1. 华为发布盘古Ultra MoE模型,参数规模达7180亿,采用深度缩放三明治范数稳定架构和TinyInit小初始化方法。
2. Perplexity Labs上线协同工具功能,集成深度网络浏览、代码执行与资产管理。
3. 小米开源多模态大模型MiMo-VL-7B,创新混合在线强化学习算法,在图像推理、GUI多步操作等任务中超越GPT-4o。
4. Anthropic开源“思维追踪”工具,通过构建归因图可视化大模型内部决策路径,支持交互式探索AI推理过程。
5. Yandex发布全球最大音乐推荐数据集Yambda,包含47.9亿条用户交互数据。
6. 阿里巴巴开源WebAgent自主搜索AI代理,具备端到端网络信息检索与多步推理能力,可自动生成研究报告。
7. 上海发布全球首个生成式类人机器人运动大模型“龙吟”,支持自然语言驱动高保真动作生成。
