AI早报 2025年08月22日
1. 字节跳动开源Seed-OSS-36B大语言模型,支持512K的原生长文本窗口和新思考预算机制,刷新多项推理能力记录。
2. 通义APP推出知识库功能,支持官方与个人知识库创建、多库联合查询,整合教育、法律等权威资料并允许用户上传自定义文档。
3. 百度MuseSteamer音视频一体化模型升级至2.0版本,首次实现多人有声视频一体化生成,支持运镜和电影级表演。
4. ElevenLabs推出Eleven v3 Alpha API,支持70多种语言的文本转语音,引入多角色对话模式和高级音频标签控制。
5. Liquid AI推出LFM2-VL视觉语言基础模型系列,包括450M和1.6B参数版本,优化低延迟和设备适应性,支持原始分辨率图像处理。
6. vivo发布Vision探索版MR头显,采用自研空间计算算法,搭载第二代骁龙XR2+平台,支持自然眼动追踪和微手势识别。

