2026 AGI-Next 前沿峰会 | 月之暗面杨植麟:Kimi K2的Scaling实践

2026 AGI-Next 前沿峰会 | 月之暗面杨植麟:Kimi K2的Scaling实践

26分钟 ·
播放数112
·
评论数3

2026 AGI Next 前沿峰会的演讲中,月之暗面(Moonshot AI)创始人兼 CEO 杨植麟深度剖析了 Kimi 模型背后的技术演进与哲学思考:

  • 他重申 Scaling Law是大模型发展的第一性原理,本质上是将能源高效转化为智能的过程。
  • 演讲的核心亮点在于对模型架构与 Agent 智能关系的拆解。杨植麟指出,Transformer 架构之所以取代 LSTM 成为主流,关键在于其在 长上下文(Long Context) 任务中展现出的低位置损失(Position Loss),这正是构建能够处理复杂任务的 Agent 的基石。为了突破现有极限,杨植麟重点介绍了两项关键技术创新:
    • MIO 二阶优化器:相比主流的 Adam 优化器,它能以 50% 的算力消耗达到同等训练效果,显著提升了 Scaling 效率。
    • Kimi Linear 架构:通过创新的线性注意力机制,成功解决了传统线性注意力在长距离任务掉点的问题,兼顾了极长的上下文窗口与极高的推理速度。
  • 杨植麟认为,Agent 的本质是在解空间中进行搜索,而优秀的预训练模型提供了关键的先验知识。面对 AGI 的未来,他强调智能应当具备独特的“品味”(Taste),且是非同质化的。尽管技术伴随风险,但他主张积极探索,将 AGI 视为拓展人类认知边界、提升文明上限的关键钥匙。
展开Show Notes
麦饵丝
麦饵丝
2026.1.14
非常感谢播客主分享一手资讯。冒昧问下是否有现场的演示文稿能搭配着听,谢谢
麦饵丝:能搜到现场视频,没事啦~
RayHu
:
嗯嗯,Youtube和B站应该都能搜到了