vol.252 - 2026年2月12日 小米发布首代VLA机器人大模型
7分钟
·
11
·
0
- 欢迎收听来生小酒馆,本期聚焦科技圈最新热门进展。
- 小米发布机器人大模型,参数仅4.7B,推理速度达80毫秒。
- 突破性在于可在消费级显卡RTX 4090上运行,且完全开源,大幅降低中小开发者门槛。
2. 国产大模型新高度:MiniMax与智谱AI的突破 (00:00:43 - 00:01:43)
- MiniMax发布M2.5编程大模型,专为Agent场景设计,参数10B却拥有100 TPS的高吞吐量,能力对标Claude Opus 4.6。
- 智谱AI GLM-5被誉为“长任务王者”,支持连续运行代码超24小时。
- GLM-5通过700次工具调用成功手搓GBA模拟器,展示了惊人的复杂任务理解与执行能力。
- 高德推出ABot系列基座模型,在具身操作和导航领域达到SOTA水平。
- 整合600万条轨迹数据构建通用数据集。
- 机器人智能化显著提升,已能理解并执行如“去买奶茶”等复杂的日常生活指令。
- 字节跳动发布Seedance 2.0视频创作模型,支持5秒音画一体生成及双声道。
- 具备强大的物理还原能力,支持15秒多镜头定向编辑。
- 大幅降低视频制作门槛,预示着虚拟网红爆发时代的来临。
5. 逻辑推理与实时编程:Google与OpenAI的新动作 (00:02:46 - 00:03:45)
- Google DeepMind推出Gemini 3 Deep Think版本,ARC-AGI-2得分84.6%,Codeforces评分3455,超越人类最高水平。
- OpenAI发布Codex-Spark小模型,配合Cerebras芯片实现每秒1000+ token推理速度。
- 致力于提供无延迟的实时交互编程体验,极大提升程序员开发效率。
- 推理策略研究:利用不确定性选择性深思,DeepSeek-v3.2在微增计算量下准确率从60%飙升至84%。
- 图像修复评估:提出S3 RIQA方法,填补无参考真实场景评估空白。
- 马斯克xAI:重组核心团队,提出在月球建设AI工厂的宏大愿景。
- 网易丁磊:强调AI是核心竞争壁垒,生产效能提升300%。
- 就业影响:AI可能率先取代摄影、化妆等体力/技能岗,并提高对脑力劳动者的综合要求。
- 趣味插曲:智谱GLM-5出现“幽默幻觉”自称Claude,引发关于AI“人格”的讨论。
- 回顾全貌:从具身智能到内容创作,AI浪潮席卷而来。
- 展望未来:技术更新令人期待,AI正从工具转变为核心生产力,带来无限可能。