vol.252 - 2026年2月12日 小米发布首代VLA机器人大模型

vol.252 - 2026年2月12日 小米发布首代VLA机器人大模型

7分钟 ·
播放数11
·
评论数0

访问网页版AI资讯日报:ai.hubtoday.app

1. 引言与硬件普惠:小米机器人大模型开源 (00:00:00 - 00:00:43)

  • 欢迎收听来生小酒馆,本期聚焦科技圈最新热门进展。
  • 小米发布机器人大模型,参数仅4.7B,推理速度达80毫秒
  • 突破性在于可在消费级显卡RTX 4090上运行,且完全开源,大幅降低中小开发者门槛。

2. 国产大模型新高度:MiniMax与智谱AI的突破 (00:00:43 - 00:01:43)

  • MiniMax发布M2.5编程大模型,专为Agent场景设计,参数10B却拥有100 TPS的高吞吐量,能力对标Claude Opus 4.6
  • 智谱AI GLM-5被誉为“长任务王者”,支持连续运行代码超24小时
  • GLM-5通过700次工具调用成功手搓GBA模拟器,展示了惊人的复杂任务理解与执行能力。

3. 具身智能进阶:高德ABot与生活化指令 (00:01:43 - 00:02:16)

  • 高德推出ABot系列基座模型,在具身操作和导航领域达到SOTA水平。
  • 整合600万条轨迹数据构建通用数据集。
  • 机器人智能化显著提升,已能理解并执行如“去买奶茶”等复杂的日常生活指令。

4. 内容创作革命:字节跳动Seedance 2.0 (00:02:16 - 00:02:46)

  • 字节跳动发布Seedance 2.0视频创作模型,支持5秒音画一体生成及双声道。
  • 具备强大的物理还原能力,支持15秒多镜头定向编辑。
  • 大幅降低视频制作门槛,预示着虚拟网红爆发时代的来临。

5. 逻辑推理与实时编程:Google与OpenAI的新动作 (00:02:46 - 00:03:45)

  • Google DeepMind推出Gemini 3 Deep Think版本,ARC-AGI-2得分84.6%Codeforces评分3455,超越人类最高水平。
  • OpenAI发布Codex-Spark小模型,配合Cerebras芯片实现每秒1000+ token推理速度。
  • 致力于提供无延迟的实时交互编程体验,极大提升程序员开发效率。

6. 前沿研究与巨头愿景:从算法优化到月球工厂 (00:03:45 - 00:05:20)

  • 推理策略研究:利用不确定性选择性深思,DeepSeek-v3.2在微增计算量下准确率从60%飙升至84%
  • 图像修复评估:提出S3 RIQA方法,填补无参考真实场景评估空白。
  • 马斯克xAI:重组核心团队,提出在月球建设AI工厂的宏大愿景。
  • 网易丁磊:强调AI是核心竞争壁垒,生产效能提升300%

7. 总结与社会思考:AI时代的机遇与挑战 (00:05:20 - 00:07:13)

  • 就业影响:AI可能率先取代摄影、化妆等体力/技能岗,并提高对脑力劳动者的综合要求。
  • 趣味插曲:智谱GLM-5出现“幽默幻觉”自称Claude,引发关于AI“人格”的讨论。
  • 回顾全貌:从具身智能到内容创作,AI浪潮席卷而来。
  • 展望未来:技术更新令人期待,AI正从工具转变为核心生产力,带来无限可能。