【AI每日情报】2026.1.15 星期四AI每日情报

【AI每日情报】2026.1.15 星期四

16分钟 ·
播放数7
·
评论数0

今日重点:Skild AI完成14亿美元融资,估值突破140亿美元,显示出机器人基础模型正成为资本的新宠。与此同时,谷歌Gemini深度整合个人应用,OpenAI秘密布局硬件,贾跃亭发布具身智能,巨头们正加速构建从软件到硬件的全方位AI生态。

一. AI技术前沿

  1. Lightricks开源LTX-2:Lightricks开源LTX-2视听合成系统,仅需20秒即可生成音画同步的高清视频,效率最高达竞品18倍,突破视频生成效率瓶颈。
  2. Mugen3D实现单图生成3D世界:全新模型Mugen3D登场,利用3D高斯溅射技术,仅需一张图片即可生成还原度近100%的3D模型,或引爆游戏与VR建模变革。微信搜:AI每日情报
  3. 中国高校研发UniCorn架构:中科大等团队发布UniCorn框架,引入“观察者、执行者、质检员”协同机制,显著提升了AI图像处理系统的逻辑准确性与自我纠错能力。
  4. MiniMax发布OctoCodingBench:MiniMax推出开源基准测试OctoCodingBench,为编程智能体在代码仓库环境中的表现提供了全新的科学评估标准。
  5. 1X发布世界模型:机器人初创公司1X发布“1X世界模型”,让Neo机器人从预设程序执行者变为自主学习者,能通过视频数据学习新技能。
  6. 谷歌开源MedGemma 1.5:谷歌发布新一代开源医疗大模型MedGemma 1.5及语音识别模型MedASR,转录错率仅5.2%,优于OpenAI Whisper,降低了医疗AI创新门槛。
  7. 智谱联合华为开源GLM-Image:智谱AI与华为联合开源图像生成模型GLM-Image,这是首个全流程基于国产昇腾算力训练的SOTA多模态模型,打破了国外算力垄断。
  8. MIT研发“运动数据工厂”:MIT等机构推出FoundationMotion,自动化生成精细化运动数据,显著提升了视频分析系统在运动理解上的准确率。
  9. Z.ai开源GLM-Image:Z.ai开源的GLM-Image模型在复杂文本渲染上击败谷歌Nano Banana Pro,展现了强大的文本生成图像能力。
  10. 苹果发布Manzano模型:苹果发布多模态模型Manzano,成功打破了视觉理解与图像生成之间的界限,实现了两者的高效融合。
  11. 新型AI模型预测疾病:美国科研人员开发出新型AI模型,仅凭一晚睡眠数据即可预测心脏病、痴呆症等约130种疾病风险。
  12. 清华研发智能眼镜:清华团队研发出基于眼镜形态的可穿戴闭环神经刺激系统,能实时监测并一键平息面部抽搐,展示了AI在医疗硬件上的创新。
  13. 逐际动力发布LimX COSA:逐际动力推出面向物理世界原生的具身智能体系统LimX COSA,让机器人兼具高阶认知与全身运控能力。
  14. 类脑计算机成数学天才:美国桑迪亚国家实验室展示类脑计算机在科学计算上的成果,能耗仅为传统计算机的1/5,误差极低。
  15. Anthropic发布Claude Cowork:Anthropic推出通用AI代理Claude Cowork,旨在为企业提供更易用、更易接入的AI协作工具。
  16. Arm成立物理AI部门:芯片巨头Arm宣布架构重组,新设物理AI部门,专注于赋能机器人与智能设备,抢占物理世界AI算力高地。

二. AI产品动态

  1. 谷歌Gemini升级“个人智能”:谷歌Gemini推出“Personal Intelligence”功能,能跨应用深度整合Gmail、Google Photos等数据,化身私人管家,提供主动式服务。
  2. OpenAI秘密开发Sweetpea硬件:消息称OpenAI正与前苹果设计总监Jony Ive合作,开发代号“Sweetpea”的AI音频设备,首年目标出货5000万台,意在挑战AirPods。
  3. Vidu上线一键生成MV功能:Vidu开放平台上线AI一键生成MV功能,用户只需提供音乐和参考图,分钟级即可生成高质量MV,打造“虚拟制片厂”。
  4. Anthropic推出Cowork:Anthropic发布Cowork工具,作为Claude Code的易用版,让非技术用户也能通过自然语言指挥AI代理完成复杂任务,降低了使用门槛。微信搜:AI每日情报
  5. 谷歌翻译上线AI多译文功能:谷歌翻译安卓版新增AI按钮,可一键生成三种不同语境的译文,帮助用户更精准地进行跨语言表达。
  6. 谷歌Veo 3.1支持竖屏视频:谷歌Veo 3.1版本发布,原生支持生成9:16竖屏视频,并嵌入YouTube Shorts,直通短视频创作生态。
  7. 日本手绘平台TEGAKI爆红:主打“禁用AI”的日本手绘平台TEGAKI上线首日注册用户超5000人,服务器被挤爆,反映了创作者对纯人工创作环境的渴望。
  8. AI手办成聊天机器人:CES上展示的AI智能底座能让手办变身聊天机器人,赋予收藏品“灵魂”,掀起AI收藏品新浪潮。
  9. 谷歌趋势探索全新改版:谷歌Trends引入Gemini技术,通过自动化识别与深度关联分析,彻底改变了用户探索热门话题的方式。
  10. Salesforce升级Slackbot:Salesforce正式推出作为个人AI代理的新版Slackbot,帮助员工处理日常任务,提升工作效率。
  11. 奥拓MetaBox助力直播:奥拓电子子公司创想数维利用AI+XR技术,为超100家品牌提供一站式直播服务,GMV超4.4亿。
  12. 阿里千问C端月活破亿:阿里千问App上线两月C端月活破亿,在年轻群体中增长迅速,阿里从B端向C端AI转型的战略初见成效。
  13. 特斯拉FSD转订阅制:特斯拉宣布2月14日起停售FSD买断版,全面转向月度订阅模式,降低用户尝试门槛,加速智驾普及。
  14. 迈富时跻身AI百强:迈富时凭借AI-Agentforce智能体中台3.0,在《2025中国AI智能体百强》榜单中高居第四,展现静安AI黑马实力。
  15. Deepgram融资1.3亿美元:语音AI初创公司Deepgram完成C轮融资,计划服务快餐连锁店,推动语音点餐自动化。
  16. Wind River领跑智能边缘:Wind River在ABI排名中击败VMware,成为智能边缘领域的首选替代方案。
  17. 2026年AI代理平台盘点:盘点企业领导者必须知道的10大AI代理平台,涵盖自动化、客户服务等多个领域。
  18. 谷歌推出通用商务协议:谷歌发布UCP协议及AI工具,旨在推动代理式购物(Agentic Shopping)的发展,重构电商未来。
  19. Windows 11整合Copilot:传Windows 11资源管理器将整合Copilot聊天窗,用户可在文件夹内直接调用AI处理文件,提升效率。
  20. JumpCloud推出AI新功能:JumpCloud发布新AI功能,用于安全管理企业AI采用,解决影子IT问题。

三. AI融资与并购

  1. Skild AI融资14亿美元:机器人基础模型开发商Skild AI完成14亿美元融资,估值突破140亿美元,软银、英伟达、贝佐斯等巨头参投,显示资本对具身智能的高度看好。
  2. OpenAI收购Torch:OpenAI斥资1亿美元(以股权形式)收购医疗记录初创公司Torch,核心团队加入协助打造“医疗记忆库”,加速医疗AI布局。
  3. VoiceRun融资550万美元:语音AI代理初创公司VoiceRun获得550万美元种子轮融资,致力于帮助企业更好地控制和部署语音AI智能体。
  4. Anthropic投资Python基金会:Anthropic宣布向Python软件基金会投资150万美元,旨在加强Python生态系统的安全性,回馈开源社区。
  5. 苹果2026年量产AI芯片:消息称苹果计划于2026年量产自研服务器AI芯片,并于2027年启用新数据中心,意在构建自主可控的AI算力底座。
  6. Phenom收购AI公司:Phenom收购AI与自动化公司,旨在应对招聘挑战,重塑未来的工作方式。微信搜:AI每日情报
  7. Baya Systems扩建研发中心:Baya Systems在班加罗尔扩建工程中心,以支持AI与高性能计算(HPC)的增长需求。
  8. Deepgram获1.3亿美元融资:语音AI初创公司Deepgram完成C轮融资,将用于拓展快餐连锁店等服务场景。
  9. Emversity融资3000万美元:印度职业培训初创公司Emversity融资3000万美元,专注于培养AI无法替代的蓝领人才,估值翻倍。
  10. OpenAI与Cerebras达成百亿交易:OpenAI与芯片制造商Cerebras达成价值100亿美元的算力交易,挑战英伟达垄断地位,开启低延迟推理新纪元。
  11. Etched.ai与Cerebras获融资:AI芯片独角兽Etched.ai和Cerebras获得巨额融资,目标直指英伟达的市场份额。
  12. Marvell 38亿美元布局数据中心:Marvell斥资38亿美元布局下一代AI数据中心市场,强化其在互连芯片领域的优势。
  13. 信实工业建AI数据中心:印度巨头信实工业豪掷7万亿卢比,建设印度最大的AI就绪数据中心,剑指全球算力市场。
  14. Infosys运行4600个AI项目:Infosys CEO透露公司正在为客户运行4600个AI项目和500个智能体,展示了企业级AI的规模化落地。

四. AI人才动向

  1. Airbnb任命新CTO:Airbnb任命Meta生成式AI负责人Ahmad Al-Dahle为新任CTO,旨在利用AI重塑旅行搜索与服务体验。
  2. Anthropic高管重组:Instagram联合创始人Mike Krieger从CPO转岗,与Ben Mann共同领导Anthropic内部孵化器“Labs”,专注实验性产品开发。
  3. Thinking Machines创始人重返OpenAI:初创实验室Thinking Machines遭遇变故,两位核心联合创始人Barret Zoph和Luke M重返OpenAI,显示出巨头对顶尖人才的虹吸效应。
  4. TCS AI员工超21万:印度IT巨头TCS虽然总体裁员,但AI相关员工数量已突破21.7万,显示出企业对AI技能人才的迫切需求。
  5. HCLTech裁员增校招:HCLTech总体裁员但增加校招,结构性调整适应AI时代,AI相关岗位逆势增长。微信搜:AI每日情报
  6. Big Tech挖角能源人才:科技巨头正在从能源行业挖角人才,以解决AI数据中心的巨大能耗问题。

五. AI创业动态与热点

  1. 马斯克回应Grok争议:针对Grok生成不良图像的争议,马斯克回应称不知情,X平台随即宣布采取措施限制Grok生成真人裸露图像。
  2. 马来西亚限制Grok:因Grok被滥用于生成色情内容,马来西亚临时限制对其访问,表明各国政府正加强对生成式AI内容的监管力度。
  3. 谷歌下线误导性健康概览:因AI概览提供误导性健康信息(如肝脏检测范围),谷歌紧急下线部分相关查询的AI功能,凸显医疗AI的严谨性挑战。
  4. AI摘要重创媒体流量:报告显示,受AI搜索摘要影响,全球新闻网站流量大幅下降。媒体行业面临转型压力,七成管理者计划让记者转型内容创作者。
  5. 苹果回应谷歌合作:针对“谷歌接管iPhone AI”的传言,苹果澄清双方仅为底层技术授权合作,核心控制权仍掌握在自己手中。
  6. 圣路易斯猴子出逃闹剧:美国圣路易斯市猴子出逃事件中,社交媒体上泛滥的AI合成图像严重干扰了搜索工作,揭示了AI造假对现实秩序的扰乱。
  7. 字节跳动加速硬件布局:字节跳动豆包AI耳机确定由歌尔代工,AI眼镜量产10万台,显示其在AI硬件领域的野心。微信搜:AI每日情报
  8. 韩国AI“国家队”争议:韩国政府主导的自主AI模型竞赛陷入争议,三家入围企业被曝使用中国或美国开源模型代码,引发对“主权AI”成色的质疑。
  9. 麦肯锡拥抱AI Agent:麦肯锡6万员工中已有2.5万是AI智能体,公司计划未来让每位员工都有AI搭档,重塑咨询业人才格局。
  10. 特朗普施压科技巨头:特朗普施压科技巨头,微软率先承诺AI数据中心不再寻求电费减免,以平衡AI发展与民生用电需求。
  11. Bandcamp封禁AI内容:Bandcamp成为首个全面禁止AI生成内容的主流音乐平台,坚定站在艺术家一边,维护人类创作价值。
  12. 英国警方归咎Copilot:英国警方将一次情报失误归咎于微软Copilot,引发对执法部门使用AI工具的信任危机。
  13. 贾跃亭发布具身智能:贾跃亭预告将在2月4日发布首批具身智能机器人并开售,FF开启“双轨驱动”战略,试图在AI领域寻找新增长点。