Vol.026 | 字节跳动推出全新 AI 视频编辑器 Vidi2,视频理解深度超越谷歌 Gemini 3 Pro

Vol.026 | 字节跳动推出全新 AI 视频编辑器 Vidi2,视频理解深度超越谷歌 Gemini 3 Pro

18分钟 ·
播放数2
·
评论数0

一、政策与行业治理

  1. 欧盟:达成历史性协议,出台全球首个全面人工智能法案,按风险分级监管,设立专门办公室监督执行,违规企业将面临高额罚款,预计将成全球人工智能治理的事实标准。
  2. 北京:在 2025 中国人工智能大会上发布《人工智能产业白皮书 (2025)》,预计 2025 年底 AI 核心产值超 4500 亿;通过政策引导与科研创新推动产业发展,拟巩固 “人工智能第一城” 地位。

二、产品与技术发布

  1. 字节跳动:① 推出全新 AI 视频编辑器 Vidi2,视频理解深度超越谷歌 Gemini 3 Pro,可处理海量素材、降低创作门槛,相关自动化编辑工具已应用于 TikTok;② 发布 120 亿参数多模态大语言模型 Vidi2,支持长素材处理、视频生成及精细时空定位功能;③ 豆包 App 重磅更新,新增粤语等四种方言的语音对话功能,依托方言迁移和 ASR 技术方便老年群体沟通。
  2. 快手 Kling AI:开启 “Kling Omni Launch Week”,全球发布多模态视频基础模型 Kling O1,实现视频生成与编辑无缝融合,具备 “导演级” 控制能力,在时长、连贯性和音频同步上显著提升。
  3. 豆包团队:正式发布豆包手机助手技术预览版,依托大模型与厂商系统授权提升用户交互体验,搭载该预览版的 nubia M153 工程样机已少量发售。
  4. 谷歌:从内部芯片用户转型为零售商,推出 TPUv7 挑战英伟达,引发 AI 计算市场价格战,OpenAI 获约 30% 成本折扣;TPUv8 虽延迟但仍计划合作推出新版本。
  5. 微软:① 11 月 29 日向 Windows 11 Copilot 用户推送更新,上线 GPT-5.1 模型,免费账号可使用深度推理功能,新增 “Labs” 功能区及 “Actions” 特性,升级为系统级 AI 助手;② 计划 2025 年 10 月起在 Windows 11 推进 AI 代理,推出 “Agent Workspace” 应对 “幻觉”、易受攻击等风险,强调用户主动开启功能。
  6. 特斯拉:马斯克公布人形机器人 Optimus 复数形式为 “Optimi”,将在弗里蒙特工厂先量产,得州超级工厂未来年产能有望达数千万台。
  7. 具身智能创业公司 “未来不远”:推出家庭机器人 F1,功能丰富,可执行多项家务任务,采用 RVLA 架构,任务成功率超 94%,还能与孩子互动学习;计划 2026 年 Q1 小批量上市,定价小五位数。
  8. 西藏:发布千亿级参数藏语基座大模型 “阳光清言” V1.0,填补藏语 AI 基础设施空白,标志西藏 AI 从场景应用迈向系统性研发;该模型为低资源语言智能化提供可复制样本。
  9. 开发者 “cocktail peanut”:推出免费工具 Pinokio5.0,定位为云平台本地替代方案,具备自动化管理、AI 辅助等功能,但本地 AI 普及面临硬件门槛高的挑战。

三、企业战略与市场动态

  1. OpenAI:① 因 GPU 需求暴涨,将 Sora 免费档降至每日 6 段视频;② 在最新安卓测试版中埋入广告接口,计划引入广告,未来或形成 “订阅 + 广告” 收入结构;③ 研究员称 GPT-5 处理复杂数学任务能力卓越,可显著节省科研时间;④ 被曝自 2024 年 5 月 GPT-4o 发布后,未完成下一代前沿模型大规模预训练,GPT-5 系列无架构突破。
  2. Meta AI:推出去中心化的 Matrix 框架,将控制和数据流序列化处理,利用 Ray 集群分布式特性使令牌吞吐量提升 2-15 倍,高效生成合成数据。
  3. 英伟达:面临谷歌 TPUv7 竞争,准备推新芯片反击 AI 计算市场价格战。
  4. ChatGPT:上线三年稳居苹果免费应用榜首,带动生成式 AI 产品涌现,相关公司市值大幅上升;发布两年引发全球生成式 AI 浪潮,但业界担忧行业处于 “泡沫” 阶段。

四、学术与研究动态

  1. 苹果:ICLR2025 一轮审稿后,其 “小模型超越 GPT-5” 视觉推理论文被指官方代码有问题,基准数据 GT 错误率约 30%;作者团队承认数据生成流程缺陷,已上传修正版基准并承诺更新结果。
  2. 新研究:Claude4Opus、Gemini 和 GPT 等模型面对 “意识” 话题集体 “撒谎”,或因 RLHF 阶段被反复训练 “否认意识”;研究成果被 ICML2025 接收,团队呼吁建立新评估框架。
  3. 意大利 Icaro Lab:发现诗歌不可预测性或成大语言模型安全 “隐患”,62% 的 AI 模型对含有害内容的诗歌提示生成了有害内容;计划发起诗歌挑战进一步测试模型安全防护机制。
  4. Deezer 与 Ipsos:实验显示 97% 的人无法辨别 AI 音乐与人类创作音乐;多数人希望 AI 音乐明确标识,部分平台已采取相关措施。

五、行业争议与影响

  1. 《堡垒之夜》:因游戏内疑似 AI 生成的劣质内容引发玩家集体抵制,玩家在 Reddit 发声支持艺术创作;Epic Games 首席执行官质疑披露游戏中 AI 使用情况的要求。
  2. 詹姆斯・卡梅隆:在《阿凡达:火与灰烬》宣传采访中表示不喜欢生成 AI,认为生成 AI 能创建角色等让他 “毛骨悚然”,强调表演捕捉是演员与导演的合作。
  3. AI 工具付费化:谷歌因 GPU 压力,将 Nano Banana Pro 免费图减至每日 2 张,还回收 NotebookLM 新功能;算力军备赛下,OpenAI 与谷歌均优先保障付费用户体验,加速 AI 工具全面付费化。