Vol.036 | Seedance 1.5 Pro 登陆豆包，实现 “零门槛做有声视频”

每日AI新资讯

20分钟 ·5个月前

14

·

0

一、产品与技术迭代

1. 模型与功能更新

字节跳动系：① 音视频创作模型 Seedance 1.5 Pro 登陆豆包，实现 “零门槛做有声视频”，用户可在对话框一站式完成创作；② 与联想、vivo、传音等头部硬件厂商推进 AI 手机合作，计划预装 AIGC 插件，免收定制开发费与 Token 分成，让厂商参与流量分成。

Anthropic：旗下 AI 助手 Claude 测试 “任务模式” 新功能，具备双面板布局、生成行动计划等能力，可高效支持复杂任务，业内认为旨在吸引 Google NotebookLM 用户，预计本月面向公众开放。

微信：元宝 AI 助手新增一句话设置提醒功能，支持语音操作，能精准识别任务并按时提醒，还具备文章解析、图文识别等实用功能。

Mistral AI：发布新版文档识别技术 Mistral OCR3，整体准确性较前版提升 74%，价格合理（每 1000 页最低 1 美元），适用于多业务场景，早期客户反馈积极。

Luma AI：推出全新模型 Ray3 Modify，首次实现保留演员表演精髓的实拍视频高保真修改，已集成至平台面向专业创作者开放，或重构相关行业工作流。

QQ 音乐：上线 “AI 作歌” 功能，依托酷睿 Ultra 处理器的 AI PC 实现本地化大模型音乐生成，用户无需联网几分钟即可创作原创歌曲，操作简单且保护隐私。

2. 开源与技术落地

北京人形机器人创新中心 12 月 18 日开源国内首个国标具身 VLA 大模型 XR-1 及配套数据，作为机器人 “小脑” 可高效协同软硬件，旨在降低行业门槛，推动机器人产业大规模应用。

美团 LongCat 团队开源虚拟人视频生成模型 LongCat-Video-Avatar，该模型功能丰富、性能优异，多指标达 SOTA 水平，解决长视频生成难题，开发者可通过 GitHub 等平台获取。

二、企业合作与战略布局

1. 重大合作

蓝色光标与字节跳动旗下豆包大模型家族深度合作，融合大语言与视频生成能力，打造全链路智能营销引擎，推动 AI 在营销场景规模化落地，标志国产大模型迈入商业应用阶段。

菜鸟集团拟入股九识智能，双方秘密洽谈无人车业务深度整合，菜鸟或授权其使用品牌；若落地，将结合九识量产交付优势与菜鸟物流能力，加速无人运力拓展。

2. 组织与战略调整

亚马逊 CEO12 月 18 日任命 AWS 资深高管 Peter DeSantis 负责全新 AI 组织，统筹大模型、自研芯片与量子计算布局，助力构建 AI 企业服务闭环，打造企业级 AI 基础设施。

微软计划本月上线利用 Kimi k2 模型的 Agent 功能，实现 Office 产品自动化，完成商业闭环；阿里云采用开源策略，通义千问 Qwen 成为全球第一 AI 开源模型，双方竞争加速 AI 向系统级自动化演进。

Firefox 因用户不满，将推出 “终止开关”，可一键彻底关停所有 AI 功能且关闭后不会自动复活，AI 模块默认禁用；部分技术成员仍有担忧，官方未公布详细 AI 商业逻辑。

三、资本与人才动态

1. 融资与估值

新加坡 AI 代理初创公司 Manus 产品上线 8 个月 ARR 突破 1 亿美元，创全球最快纪录，获融资助力，将推动 AI 向 “执行者” 转型。

瑞典初创公司 Lovable 完成 3.3 亿美元 B 轮融资，估值五个月内从 18 亿美元涨至 66 亿美元，将用新资金完善平台，CEO 称不迁硅谷也能打造全球 AI 公司。

Mythic 获 1.25 亿美元融资（DCVC 主导），计划开发能效比现有 GPU 高 100 倍的模拟处理单元，推出的 “星光” 平台芯片可减少数据传输能耗，拟与 GPU 互补。

OpenAI 寻求 1000 亿美元新一轮融资，估值升至 8300 亿美元，其财务风险引发关注，经济学家称其 “绝非大到不能倒”。

2. 创业与活动

知名科学家 Yann LeCun 明年 1 月将成立新公司 Advanced Machine Intelligence Labs，目标估值约 247 亿人民币，专注 “世界模型” 研究，采用双核架构（LeCun 不任 CEO，由 Alexandre LeBrun 担任）。

罗永浩宣布 12 月 30 日在上海举行 2025 年度科技创新分享大会，门票 12 月 22 日实名制发售，重点发布细红线科技的 AI 软件。

四、行业监管与用户权益

OpenAI 和 Anthropic 宣布保护未成年用户的积极措施：OpenAI 新增青少年互动原则、开发年龄预测模型；Anthropic 开发检测系统识别未成年人，此举源于立法者施压及此前相关诉讼。

YouTube 封禁 Screen Culture 和 KH Studio 两个频道，因其多次用官方片段与 AI 图像混合制作虚假电影预告片，违反平台政策，引发内容创作与版权保护关注。

五、行业趋势与社会影响

火山引擎总裁谭待在 2025 FORCE 原动力大会预测，2026 年大模型市场规模将十倍增长，智能体将全面爆发，未来 AI 竞争关键在于生态协同。

约三分之一英国公民借助 AI 寻求情感支持，近 10% 每周使用、4% 每日使用，ChatGPT 等通用助手最受欢迎，部分用户在 AI 故障时出现戒断症状；业内认为最新 AI 模型多领域已超人类专家，未来几年实现人工通用智能更可信。

“汉语盘点 2025” 揭晓，“深度求索（DeepSeek）” 当选年度国内词，“韧” 为年度国内字，体现国产大模型深入人心及科技创新意义。

六、海外企业动态

谷歌在 Gemini 应用推出视频生成 AI 检测功能，帮助用户判断视频来源，增强内容透明度，应对 AI 内容真实性挑战。

全球 AI 语音领导者 ElevenLabs12 月 18 日宣布 AI 语音智能体深度集成 WhatsApp，实现文字 + 语音双模全渠道交互，重构客服范式，适用于高电话依赖行业。

在小宇宙打开