Vol.036 | Seedance 1.5 Pro 登陆豆包,实现 “零门槛做有声视频”

Vol.036 | Seedance 1.5 Pro 登陆豆包,实现 “零门槛做有声视频”

20分钟 ·
播放数14
·
评论数0

一、产品与技术迭代

1. 模型与功能更新

  • 字节跳动系:① 音视频创作模型 Seedance 1.5 Pro 登陆豆包,实现 “零门槛做有声视频”,用户可在对话框一站式完成创作;② 与联想、vivo、传音等头部硬件厂商推进 AI 手机合作,计划预装 AIGC 插件,免收定制开发费与 Token 分成,让厂商参与流量分成。
  • Anthropic:旗下 AI 助手 Claude 测试 “任务模式” 新功能,具备双面板布局、生成行动计划等能力,可高效支持复杂任务,业内认为旨在吸引 Google NotebookLM 用户,预计本月面向公众开放。
  • 微信:元宝 AI 助手新增一句话设置提醒功能,支持语音操作,能精准识别任务并按时提醒,还具备文章解析、图文识别等实用功能。
  • Mistral AI:发布新版文档识别技术 Mistral OCR3,整体准确性较前版提升 74%,价格合理(每 1000 页最低 1 美元),适用于多业务场景,早期客户反馈积极。
  • Luma AI:推出全新模型 Ray3 Modify,首次实现保留演员表演精髓的实拍视频高保真修改,已集成至平台面向专业创作者开放,或重构相关行业工作流。
  • QQ 音乐:上线 “AI 作歌” 功能,依托酷睿 Ultra 处理器的 AI PC 实现本地化大模型音乐生成,用户无需联网几分钟即可创作原创歌曲,操作简单且保护隐私。

2. 开源与技术落地

  • 北京人形机器人创新中心 12 月 18 日开源国内首个国标具身 VLA 大模型 XR-1 及配套数据,作为机器人 “小脑” 可高效协同软硬件,旨在降低行业门槛,推动机器人产业大规模应用。
  • 美团 LongCat 团队开源虚拟人视频生成模型 LongCat-Video-Avatar,该模型功能丰富、性能优异,多指标达 SOTA 水平,解决长视频生成难题,开发者可通过 GitHub 等平台获取。

二、企业合作与战略布局

1. 重大合作

  • 蓝色光标与字节跳动旗下豆包大模型家族深度合作,融合大语言与视频生成能力,打造全链路智能营销引擎,推动 AI 在营销场景规模化落地,标志国产大模型迈入商业应用阶段。
  • 菜鸟集团拟入股九识智能,双方秘密洽谈无人车业务深度整合,菜鸟或授权其使用品牌;若落地,将结合九识量产交付优势与菜鸟物流能力,加速无人运力拓展。

2. 组织与战略调整

  • 亚马逊 CEO12 月 18 日任命 AWS 资深高管 Peter DeSantis 负责全新 AI 组织,统筹大模型、自研芯片与量子计算布局,助力构建 AI 企业服务闭环,打造企业级 AI 基础设施。
  • 微软计划本月上线利用 Kimi k2 模型的 Agent 功能,实现 Office 产品自动化,完成商业闭环;阿里云采用开源策略,通义千问 Qwen 成为全球第一 AI 开源模型,双方竞争加速 AI 向系统级自动化演进。
  • Firefox 因用户不满,将推出 “终止开关”,可一键彻底关停所有 AI 功能且关闭后不会自动复活,AI 模块默认禁用;部分技术成员仍有担忧,官方未公布详细 AI 商业逻辑。

三、资本与人才动态

1. 融资与估值

  • 新加坡 AI 代理初创公司 Manus 产品上线 8 个月 ARR 突破 1 亿美元,创全球最快纪录,获融资助力,将推动 AI 向 “执行者” 转型。
  • 瑞典初创公司 Lovable 完成 3.3 亿美元 B 轮融资,估值五个月内从 18 亿美元涨至 66 亿美元,将用新资金完善平台,CEO 称不迁硅谷也能打造全球 AI 公司。
  • Mythic 获 1.25 亿美元融资(DCVC 主导),计划开发能效比现有 GPU 高 100 倍的模拟处理单元,推出的 “星光” 平台芯片可减少数据传输能耗,拟与 GPU 互补。
  • OpenAI 寻求 1000 亿美元新一轮融资,估值升至 8300 亿美元,其财务风险引发关注,经济学家称其 “绝非大到不能倒”。

2. 创业与活动

  • 知名科学家 Yann LeCun 明年 1 月将成立新公司 Advanced Machine Intelligence Labs,目标估值约 247 亿人民币,专注 “世界模型” 研究,采用双核架构(LeCun 不任 CEO,由 Alexandre LeBrun 担任)。
  • 罗永浩宣布 12 月 30 日在上海举行 2025 年度科技创新分享大会,门票 12 月 22 日实名制发售,重点发布细红线科技的 AI 软件。

四、行业监管与用户权益

  • OpenAI 和 Anthropic 宣布保护未成年用户的积极措施:OpenAI 新增青少年互动原则、开发年龄预测模型;Anthropic 开发检测系统识别未成年人,此举源于立法者施压及此前相关诉讼。
  • YouTube 封禁 Screen Culture 和 KH Studio 两个频道,因其多次用官方片段与 AI 图像混合制作虚假电影预告片,违反平台政策,引发内容创作与版权保护关注。

五、行业趋势与社会影响

  • 火山引擎总裁谭待在 2025 FORCE 原动力大会预测,2026 年大模型市场规模将十倍增长,智能体将全面爆发,未来 AI 竞争关键在于生态协同。
  • 约三分之一英国公民借助 AI 寻求情感支持,近 10% 每周使用、4% 每日使用,ChatGPT 等通用助手最受欢迎,部分用户在 AI 故障时出现戒断症状;业内认为最新 AI 模型多领域已超人类专家,未来几年实现人工通用智能更可信。
  • “汉语盘点 2025” 揭晓,“深度求索(DeepSeek)” 当选年度国内词,“韧” 为年度国内字,体现国产大模型深入人心及科技创新意义。

六、海外企业动态

  • 谷歌在 Gemini 应用推出视频生成 AI 检测功能,帮助用户判断视频来源,增强内容透明度,应对 AI 内容真实性挑战。
  • 全球 AI 语音领导者 ElevenLabs12 月 18 日宣布 AI 语音智能体深度集成 WhatsApp,实现文字 + 语音双模全渠道交互,重构客服范式,适用于高电话依赖行业。