Vol.005 | 美团开源视频生成模型 LongCat-Video

Vol.005 | 美团开源视频生成模型 LongCat-Video

4分钟 ·
播放数3
·
评论数0

日期:2025年10月27日

(一)美团视频生成模型:LongCat-Video

  1. 核心属性:开源模型
  2. 参数规模:136 亿参数
  3. 技术架构:采用统一架构
  4. 核心功能:支持文生视频、图生视频、视频续写三种模式
  5. 性能表现:在内部测试与公开基准测试中表现出色,可媲美领先开源模型及最新商业解决方案

(二)OpenAI 双向语音模型

  1. 发布场景:伦敦 “OpenAI Frontiers” 活动现场演示
  2. 核心能力:实时翻译
  3. 技术特点:非逐字翻译,等待用户说话过程中的关键动词出现后再执行翻译
  4. 发布计划:预计未来几周内正式发布

(三)Cursor 2.0 版本

  1. 发布主体:Cursor 设计主管 Ryo Lu 宣布
  2. 核心信息:预告即将发布 2.0 版本(未提及具体功能更新)

(四)谷歌 AI Studio 相关更新

(五)Suno v4.5all 模型

  1. 开放范围:面向所有用户(含免费用户)
  2. 开放状态:近期已正式开放(未提及具体功能细节)