AI日报精选播客 | 小宇宙 - 听播客，上小宇宙

3已订阅

AI日报精选播客

子豪的AI工坊

单集更新

节目详情

ChatGPT 变身 AI 搜索，与谷歌的新较量
11月真是大事多发鸭，ChatGPT 变身 AI 搜索，与谷歌的新较量从今天起，ChatGPT新增了搜索功能，网页版、手机版、桌面版同时上线。这背后是OpenAI旗舰模型GPT - 4o的微调版本在支撑。CEO奥特曼对这个新功能可是喜爱有加，他说自从有了搜索功能，他使用ChatGPT的频率都大大提高了。你可能会问，为什么OpenAI这么迟才给ChatGPT加上搜索功能呢？我觉得可能是在等谷歌宣布搞AI搜索的时候，想要压对方一头吧。就在ChatGPT变AI搜索的几乎同时，Google也宣布了相关举措。 ChatGPT搜索有很多亮点哦。它可以快速获取准确答案，还会提供相关网页链接，不用再切换到其他搜索引擎了。而且付费用户以及一些在候补名单里的朋友今天起就可以首批公测，企业用户和教育用户在接下来几周内会获得权限，几个月后所有用户都能免费使用。我自己也对它进行了实测。我发现它很智能，提问时就算忘记开搜索，如果AI判断需要联网，它会自动打开。查询天气、股票、体育等信息都很方便，不过股票模块还有待完善。它和其他AI搜索引擎相比，也有自己的优势。比如在Github仓库搜索方面，它能直接给出安装和使用方法。虽然现在市场上已经有很多AI搜索引擎了，但ChatGPT搜索还是有它独特之处的。我很期待看到它在未来的发展，相信它会给我们的搜索体验带来更多的改变。
1分钟 · 2年前
27
0
钢铁侠扮演者对 AI 复制品说 “不”
大家好，我是今天的播客讲述人。今天要和大家聊聊小罗伯特・唐尼，这位大家熟知的 “钢铁侠” 扮演者的一个重要态度 —— 坚决反对被 “AI 化”。我想大家都对小罗伯特・唐尼在漫威电影宇宙中饰演的钢铁侠印象深刻吧。在最近参加的一个播客节目中，他非常明确地表达了自己对 AI 技术和深度伪造技术在荧幕上复刻他形象的反对态度。他对漫威不会使用 AI 重塑托尼・斯塔克这个角色还是很有信心的，他觉得漫威的决策者不会剥夺这个角色的 “灵魂”。唐尼说他对自己的真实生活有很深厚的情感，对于数字复制品他可没有什么情感投入。而且当被问到如果未来有高管想要重现他的数字形象时，他的态度十分坚定，他说他打算起诉所有批准使用他数字复制品的未来高管们。即使有人提醒他可能那时他已经去世了，他还幽默地表示他的律师事务所仍然会很活跃。唐尼现在还在参演百老汇话剧《McNeal》，这部话剧聚焦 AI 领域的企业巨头。他谈到对这些科技界大佬的看法时，也很有意思。他并不羡慕那些因信息时代浪潮而被高度标榜的科技领袖，他觉得那种认为自己拥有大型初创公司就理应掌控一切的想法很荒谬。他还说这些人追求外界正面形象时的心态让他感到厌恶，他甚至不愿意和他们打交道，因为他们不够真诚。唐尼的这个表态让我们看到了他对个人形象和版权保护的严肃态度。在 AI 技术快速发展的今天，如何平衡创新与个人权利的保护，确实是一个很重要的问题，值得我们大家去思考。
1分钟 · 2年前
3
0
Gemini 2.0 加持，谷歌 “贾维斯” 即将降临
大家好，我是今天的播客主播。今天要和大家聊聊一个超级令人兴奋的话题 —— 谷歌版贾维斯。你们知道吗？科幻作品里的智能助手贾维斯似乎就要在现实中出现啦。据消息称，谷歌正在开发一个类似的项目，叫 Project Jarvis，预计在今年 12 月就会亮相哦。它可是由强大的 Gemini 2.0 加持的呢。这个 Project Jarvis 到底有多厉害呢？它能够自动操控 Chrome 浏览器完成各种网页任务。就像我们平时在网上收集研究信息、购物或者预定航班这些事情，它都可以帮我们搞定。它的工作原理和之前 Anthropic 展示的 Claude 3.5 有点类似，会截屏、解析屏幕内容，然后自动点击按钮或者输入文本。不过它在执行操作的时候会有几秒钟的思考时间，所以目前还只能在云上操作。其实在 AI 自主操控电脑这个领域，很多科技大厂都在发力。比如微软开源了 OmniParser，它可以解析屏幕，帮助 AI 理解用户意图，从而完成一些复杂任务。OpenAI 内部也有了可以操控计算机完成在线订餐、解决编程难题等任务的 AI 智能体雏形。苹果也预计在明年发布具有跨多个 APP 屏幕识别能力的产品。我真的特别期待谷歌版贾维斯的问世。它可能会给我们的生活和工作带来巨大的改变。想象一下，以后我们可以更轻松地完成各种网上操作，节省很多时间和精力。让我们一起关注这个项目的进展，看看未来的智能助手到底能给我们带来多少惊喜吧。
2分钟 · 2年前
3
0
超级小爱，如何走进我们的生活？
大家好，欢迎来到本期播客。今天我要和大家聊聊小米全新的 “超级小爱”。你们知道吗？小米的小爱同学升级啦，变成了 “超级小爱”。就像我们身边的一个小伙伴，它经历了一次令人惊喜的蜕变。以前的小爱同学就已经很厉害了，能听我们说话，也能给我们回应。但是现在的 “超级小爱” 更强大了。它不再仅仅是能听能说，而是能想、能干。当我们唤醒它的时候，它不再只是简单地说 “我在”，它可能在看周围的环境，在读我们给它的信息，在写我们需要的内容，还能直接操作一些设备，甚至能关心我们的生活。从小米官方透露的消息来看，“超级小爱” 在唤醒应答词上会有新的变化，会增加 “状态” 类回应。这意味着它会更像一个有感知的朋友。而且它有望操控更多的小米生态产品，这会让我们的生活更加便捷。其实小爱同学在今年 7 月末就有一次大版本更新，升级为「大模型小爱」，已经具备了自然问答、图片编辑、车外唤醒防御等功能，覆盖了很多设备，像手机、平板、电视、音箱、汽车等等。我真的很期待 “超级小爱” 正式亮相，相信它会给我们的生活带来更多的惊喜和便利。让我们一起关注小米的发布会，看看这个全新的智能助手到底有多强大。
2分钟 · 2年前
6
0
Runway Act - One：一部手机就能搞定电影级动画？
1. Runway 的 Act - One 功能为 AI 视频创作带来革命性变化，能让用户通过简单输入快速生成有丰富表情的角色动画。它降低技术门槛，在面部表情捕捉方面出色，对独立电影制作和数字媒体领域有革新意义。 2. 介绍 Runway 的 Act - One，它解决了 AI 视频创作者长期面临的面部表情捕捉难题。用户可用手机摄像头录制表情并映射到 AI 角色上。该工具逐步推出，部分用户可试用，它能简化创作过程，在不同摄像机角度下呈现真实感，提升叙事能力。 3. Runway 推出 Act - One 工具，允许用户用手机录制面部表情并精确映射到 AI 生成角色。此工具对动画师、游戏开发者和电影制作人有优势，可适应不同角色设计，还具备安全措施。它将复杂动画技术变得触手可及，开启新的创作可能。
3分钟 · 2年前
9
0
DeepMind 的挣扎：谷歌阴影下的 AI 之梦
DeepMind由哈萨比斯等人创立，致力于AGI研究。谷歌2014年收购DeepMind，交易中DeepMind拟定协议保护知识产权。哈萨比斯一直强调DeepMind的独立性，包括坚持其留在伦敦，签署相关审查协议等。 DeepMind在AI领域取得诸多成果，如AlphaGo击败围棋冠军等，但也面临一些问题。一方面，研究成果发表受限，内部管理严格，影响学术氛围和员工忠诚度；另一方面，财务上亏损严重。在与谷歌的关系中，控制权问题日益关键。收购五年后，创始人分红时间被推迟。谷歌成立医疗保健部门后，DeepMind Health被纳入母公司工作，引发员工不满。尽管面临种种挑战，DeepMind在技术研发上仍在前进，同时也在努力应对现实世界的复杂情况，哈萨比斯始终以游戏为工具追求AGI梦想，希望在谷歌的影响下保持独立并实现目标。
3分钟 · 2年前
1
0
豆汁有股酸味？讯飞星火 4.0 Turbo 这样解答老外的疑惑
科大讯飞全球 1024 开发者节：星火 4.0 Turbo 携七项第一与 11 个首发璀璨登场 https://m.163.com/dy/article/JF9NKD740511ABV6.html 豆汁有股酸味？讯飞星火 4.0 Turbo 这样解答老外的疑惑豆汁内含有乳酸，发酵后会产生特有的酸味。 2024科大讯飞全球1024开发者节开幕式上，讯飞星火4.0 Turbo正式发布，有七项第一和11个首发。首发多模态视觉直接抢先GPT - 4o，还有超拟人数字人交互引发关注。 1. **模型能力** - 是首个基于全国产算力训练的全面开放大模型，在9项国际主流测试集中取得第一，综合能力在国产大模型中居首，部分能力超过GPT - 4o，效率提升50%。 - 首发多语言大模型，支持8个新语种，整体性能达GPT - 4o的96%，部分语种通用能力超越GPT - 4o。 - 语音识别首次实现全国地级市方言全覆盖。 2. **应用成果** - **多模态交互**：从语音交互拓展到实时音视频流的动态多模交互，在拟人度、情感度等方面升级，能应对不同场景，如识别玩具动作、商品信息等。 - **超拟人数字人**：业界率先实现语义贯穿的“口唇 - 表情 - 动作”的超拟人数字人，表情动作根据语音和语义生成，更自然真实，还可通过讯飞星火APP创建数字分身并聊天。 - **赋能千行百业**：在赋能科研应用、智能汽车市场、教育医疗市场、大模型开发者生态、工业大模型、智能硬件市场、央国企中标七大领域夺得第一。 - 科研方面，星火科研助手2.0提升科研调用效率，还在生物科技、科学装置等联合攻关取得成果。 - 汽车领域，与多家车企合作，装配量超6000万辆，发布汽车端侧星火大模型，提升交互能力。 - 教育医疗，联合首发高中数学智能教师助手，医疗模型升级，提供多种服务。 - 开发者生态，开发者总数超700万，牵头成立创业基金，适配国产算力。 - 工业方面，诞生20 +行业大模型，300 +智能体应用。 - 智能硬件，产品矩阵GMV同比增长，如讯飞星火智能硬件GMV在2024年1 - 9月同比提升50%。 - 央国企中标数和金额第一，为企业提供解决方案。
2分钟 · 2年前
4
0
马斯克 xAI API 上线，高价背后有何乾坤？
1. 马斯克 xAI API 闪亮登场，价格却高达 GPT-4o 的两倍，开发者纷纷吐槽，这背后究竟隐藏着怎样的考量？ 2. 3. 深入剖析 xAI API，其后端由 Rust 语言编写，多地区支持、本地或云上运行等特性究竟有何优势？ 4. 5. 网友们积极试用 xAI API，构建各种智能体，它会成为新的开发利器吗？我们拭目以待。
2分钟 · 2年前
3
0
Claude 3.5 震撼升级！学会用电脑，编码能力超越 OpenAI o1，AI 操作电脑新时代来临
亲爱的听众朋友们，今天我们要聊聊 AI 领域的一个重大新闻。Claude 3.5 迎来了重磅升级！Anthropic AI 公司推出了 Claude 3.5 Haiku 和 Claude 3.5 Sonnet 两个版本。其中，Claude 3.5 Sonnet 堪称最强推理模型，一举击溃 OpenAI o1，在各个方面都有显著提升，尤其是编码能力，在多项行业基准测试中表现出色。但更令人惊讶的是，Claude 3.5 Sonnet 能够像人类一样使用计算机了！它可以查看屏幕、移动光标、点击按钮、输入文本，还能查找代码错误、自动搜集信息填表等。在公测中，开发者可以通过 API 指导它完成这些操作，虽然这项功能还处于实验阶段，使用起来有些笨拙且可能出错，但这无疑是一个巨大的突破。 Anthropic 开发者关系主管表示，“计算机使用” 是全新人机交互范式的第一步，也是 AI 模型应具备的全新基础能力。这一升级让许多做浏览器智能体的初创公司一夜之间变得过时。为了让大家更好地理解 Claude 3.5 Sonnet 的能力，我们来看几个例子。比如，当被要求安排在金门大桥看日出的活动时，它会自行打开 Google 搜索相关信息，打开地图查找距离，还会打开日历安排日程。在自动编码写网站的演示中，它能在 Chrome 浏览器中导航到 Claude.ai 并请求创建个人主页，还能下载文件、在 VS Code 中打开并修改，甚至能发现并修复代码错误，成功启动服务器运行网站。在自动寻找数据填表的测试中，它也能截取屏幕截图，搜索所需信息并完成表格填写。从测试数据来看，在 OSWorld 测试中，Claude 3.5 Sonnet 在仅基于屏幕截图的任务类别中得分为 14.9%，虽远超其他 AI 系统，但仍远低于人类 72.36% 的表现。不过，随着模型与环境的多次交互，其任务性能会得到优化。另外，Claude 3.5 Haiku 虽然是 “最小杯”，但也是 Anthropic 速度最快的模型，它保持了与 Claude 3 Haiku 相同的运行成本和相近的处理速度，且在各项技能上全面提升，在多项智能基准测试中甚至超越了 Claude 3 Opus，在编码任务上表现尤为卓越。 Anthropic 是如何教会 Claude 操作电脑的呢？研究人员训练它准确计算像素以完成命令，让它能将用户指令转化为一系列逻辑步骤来执行操作，遇到障碍时还能自我纠正、重试任务。虽然 Claude 目前的操作还存在一些问题，比如相对缓慢且容易出错，无法像人类一样熟练地进行拖拽、缩放等操作，观察屏幕的方式也有待改进，但它的未来发展让人充满期待。相信在不久的将来，AI 操作电脑的能力会有更大的进步，也许软件开发小白都能轻松使用它。
3分钟 · 2年前
2
0
骁龙峰会 2024：荣耀与高通携手定义 AI 原生应用场景
1. 高通骁龙峰会 2024 上，荣耀终端有限公司相关人员出席。荣耀 Magic7 系列灰色真机首次曝光，荣耀与高通联合研发，共同定义 AI 时代应用场景，荣耀 Magic7 系列影像和游戏将首次搭载生成式 AI 能力。 2. 荣耀与高通在智慧互联、交互变革、性能提升三大领域有合作成果。智慧互联实现原生 AI 服务跨终端跨系统无缝流转；交互创新有荣耀 AI 智能体带来新体验；性能提升方面有端侧 AI 技术赋能硬件。 3. 10 月 23 日 MagicOS 9.0 将面世，10 月 30 日荣耀 Magic7 系列将上市，将带来更多 AI 魔法体验。
3分钟 · 2年前
4
0
AI 周报聚焦：字节跳动 “投毒” 风波，微软服务调整及更多行业热点
本周 AI 行业动态频出。字节跳动商业化团队实习生 “投毒” 事件引发关注，实习生对资源分配不满，利用漏洞损害团队模型训练成果，但不影响正式项目及其他业务，字节跳动已辞退该实习生并同步其行为给相关方，此事件暴露安全管理问题。微软将终止中国个人 Azure OpenAI 服务，10 月 21 日关停，未来只有企业客户可订阅。谷歌 AI 团队架构再调整，Gemini App 应用团队并入 Google DeepMind 等。亚马逊投资 5 亿美元发展核能以满足云计算对清洁能源需求。英伟达股价一度触及历史新高。社交平台 X 允许第三方使用用户数据训练 AI。芯片企业称半导体市场七成增加与 AI 相关。中国生成式人工智能服务大模型注册用户超 6 亿，工信部提出相关发展方向。台积电发布财报后市值跻身全球前八，释放 AI 需求强劲信号。
2分钟 · 2年前
1
0
天玑 9400 如何引领 AI 手机新时代
2024 年 10 月 9 日，联发科技发布旗舰级 5G 智能体 AI 芯片天玑 9400。它采用台积电第二代 3nm 制程工艺，搭载第二代全大核架构 CPU，包括 Cortex - X925 核心等，单核性能较天玑 9300 提升 35%，多核提升 28%。GPU 方面，全新 12 核 GPU 性能提升且功耗降低，还支持先进技术。NPU 集成第八代处理器，AI 性能领先。同时引入三星 LPDDR5X 技术并优化缓存布局应对 “内存墙”。天玑 9400 还实现 AI 跨应用串联，集成 DAE 引擎，首发端侧 LoRA 训练技术。它的发布对手机行业影响重大，2024 年被视为 AI 手机普及元年，未来端侧 AI 能力是芯片竞争关键。SoC 是 AI 手机的核心，天玑 9400 的第二代 3nm 制程更成熟，安卓阵营芯片生态主要围绕联发科与高通，AI 手机的竞争使创新压力转移到 SoC 厂商。
3分钟 · 2年前
8
0
ChatGPT 桌面版登陆 Windows，微软 Azure OpenAI 国服服务终止？快来了解！
2024 年 10 月 18 日消息，OpenAI 发布 ChatGPT Windows 客户端，目前正进行测试，付费用户可在微软应用商店下载。该应用本质是网页版套壳，支持多种功能，测试完成后将向所有用户开放。同时，微软 Azure OpenAI 接口终止向中国大陆个人用户提供服务，企业客户仍有资格订阅。苹果加速整合 ChatGPT，后端代码显示将在 Siri 中整合文本 / 图像生成能力。阿里巴巴国际部推出 AI 翻译工具 Aidge，准确性宣称超越谷歌 / ChatGPT。此外，诺奖得主迈克尔・莱维特在会议上表示 ChatGPT 比自己智商高很多，自己经常使用。这些 AI 领域的新动态反映了行业的快速发展和变化，对用户和相关从业者都具有重要意义。
2分钟 · 2年前
2
0
零一万物 Yi - Lightning 超越 GPT - 4，背后技术、性能及性价比大揭秘
10 月 16 日零一万物发布旗舰模型 Yi - Lightning，在 LMSYS 盲测中排名世界第六，中国第一，超越 GPT - 4o - 2024 - 05 - 13、Claude 3.5 Sonnet 等。其 API 价格极低，每百万 token 仅 0.99 元。Yi - Lightning 在艰难提问和长提问方面表现出色。同日还公布了 AI 2.0 数字人，应用场景广泛，涵盖多个行业，某酒旅企业接入后 GMV 上升 170%。零一万物已在多领域落地 ToB 解决方案，与众多头部企业合作，积累了付费企业客户。Yi - Lightning 是 “模基共建” 战略里程碑，也是 “模应一体” 的重要基石，公司坚持三位一体全栈式布局。
2分钟 · 2年前
3
0
英伟达再创历史新高，能否超越苹果成全球市值第一？
2024 年 10 月 14 日，英伟达股价收于 138.07 美元，超过 6 月 18 日的历史高点，市值飙升至 3.39 万亿美元，仅次于苹果。今年以来股价上涨约 180%，自 2023 年初以来已飙升近 9 倍。本播客将探讨英伟达是否能超越苹果成为全球市值第一
3分钟 · 2年前
0
0

AI日报精选播客