AI早报 2025年08月20日
1. DeepSeek发布并开源大语言模型DeepSeek-V3.1,上下文窗口扩展至128K tokens,官网和API均已上线。
2. 中山大学、鹏城实验室与美团联合发布X-SAM图像分割模型,实现从“分割万物”到“任意分割”的突破,支持多种视觉和文本查询输入。
3. 英伟达推出9B模型Nemotron Nano v2,在复杂推理基准测试上准确率与Qwen3-8B相当,支持“思考”预算控制。
4. 腾讯发布大模型训练库WeChat-YATT,专注于强化学习和多模态模型训练,通过定制化并行计算策略解决大尺寸模型和长序列输入问题。
5. 淘天集团提出3B多模态大模型CombatVLA,在动作角色扮演游戏的战斗任务中成功率超越GPT-4o和人类玩家。
6. Vercel发布AI前端开发工具v0的iOS版本,利用自然语言生成全栈Web应用,提升开发效率。

