

2025年9月30日 每天5min了解前沿AI动态大家好,欢迎收听今天的AI一日谈。今天是9月30日,我将带你快速扫过国内外最热的AI与前沿科技动态。废话不多说,直接开整。 第一条:Claude Sonnet 4.5 登场 Anthropic发布新一代Claude Sonnet 4.5,强调“长时间连续编程”和大规模代码生成能力,行业关注点在于其对开发者工作流与智能体编排的提升空间。多模态理解与复杂任务的“长链路稳定性”成看点。 第二条:荣耀“阿尔法”线下落地 荣耀阿尔法全球旗舰店在深圳湾开业,定位为“AI终端智慧生活创新工坊”。这意味着其从“AI终端生态”战略转向实体化展示与用户体验拉通,品牌也借此建立AI生态的线下枢纽。 第三条:Windows 团队重组押注“AI 操作系统” 微软将客户端与服务器工程团队整合,由Pavan Davuluri统筹,目标是加速“AI OS”战略推进。工程组织的“一体化”意味着Windows层面的AI能力与设备生态将更快地打通。 第四条:OpenAI 上线家长控制与安全路由 OpenAI宣布在ChatGPT引入“家长控制”和安全路由测试,聚焦敏感对话的安全补全与模型切换机制,减少“幻觉式迎合”的风险点。对普通用户意味着默认安全网进一步加厚。 第五条:DeepSeek 升级带动“芯片/科创”行情 受DeepSeek V3.2-Exp等模型更新及国产化适配消息刺激,A股“科创50/芯片”等指数走强。市场把“模型升级→算力与半导体链景气度”视作共振主线,观望国庆后持续性。 第六条:恒为科技收购AI应用公司引爆股价 恒为科技拟以发行股份+现金方式收购数珩科技75%股权,转向下游场景化AI应用。复牌后股价“一字板”,资本市场期待其AI业务的收入与落地确定性。 第七条:机器人赛道继续升温 宁波立聚动力获乐聚机器人和中大力德入股,业务涵盖芯片设计、智能机器人与AI行业应用集成等。机器人核心零部件与系统集成“链上合纵连横”的趋势更明显。 第八条:能源×AI 基建一体化落地 道通科技在美国北卡完成首个“充电+储能一体化(EV+BESS)”项目并通过杜克能源审批。对智能出行与电网互动而言,储充一体化正从PPT走向规模化部署。 第九条:具身智能再上热搜位 “第二届中关村具身智能机器人应用大赛”开启报名,官方强调“真干活”的落地导向。配合近日多地机器人论坛与展会热度,具身智能正从“演示秀场”迈向“可用工人”。 第十条:一线评论视角——“AI狂飙,地基不牢?” 36氪深度稿聚焦甲骨文转向AI基础设施后的巨额投入与现金流压力、数据中心与能源配套的沉重成本,抛出一个直面问题:AI产业化加速期,谁来为“地基工程”买单? 以上就是AI一日谈的全部内容了,今天就到这里,感谢收听,我们明天见。
2025年9月29日 每天5min了解前沿AI动态欢迎收听AI一日谈。大家好!我是Frankie。以下是今天最值得关注的几条新闻。 第一条:华为盘古718B跃居开源阵营第二 SuperCLUE最新一期榜单出炉,7180亿参数的MoE模型openPangu-Ultra-MoE-718B在“开源、国产”维度冲到前列;榜单聚焦数学/科学推理、代码、Agent、幻觉控制和指令遵循六维评估。看点是大参数+MoE在综合能力上的稳定性。 第二条:HLE“人类最后考试”首破60分,Eigen-1多智能体跑赢GPT-5 耶鲁/上交/UCLA/牛津等团队发布的Eigen-1在HLE Bio/Chem Gold测试集Pass@5达61.74%,首次跨越60分,并宣称超越Gemini 2.5 Pro与GPT-5等闭源大模型;亮点是基于开源DeepSeek V3.1的多智能体协作。 第三条:GPT-5被量子计算大牛“点赞”,不到半小时给出关键证明思路 Scott Aaronson在博文中称,GPT-5在量子复杂性理论问题上提供了可教的证明框架,相比一年前同类尝试有明显跃升;再度引发“前沿数学/理论推理是否开始可用”的讨论。 第四条:Flash Attention作者Tri Dao预判,NVIDIA三年内不再“统治一切” Tri Dao在最新播客中称,未来2–3年AI硬件会按“传统聊天/极低时延/高吞吐批处理”三类负载走向专用芯片共存,配合MoE、量化与软硬协同,整体推理成本继续走低,生态将多元化。 第五条:腾讯研究院发布AIGC普及度报告,使用比例达96.2%,期待与焦虑并存 对3570名网民的调研显示,67.7%“每天用AI”,但对职业前景、信息真实性与公平性的担忧显著;“效率赋能—职业焦虑”的双重心态成当下主旋律。 第六条:浪潮信息打成本与时延组合拳,百万Token“1块钱”、8.9ms生成 在人工智能计算大会上,浪潮信息发布HC1000等新品,宣称把大模型推理成本压到百万Token约1元,并把R1类模型的单Token生成时延拉到毫秒级,直指“智能体产业化三要素”的速度与成本。 第七条:商汤Seko上线1个月突破10万创作者,对话式“创编一体”AI短片Agent Seko集成多模态模型,用户“对话到出片”一站式完成;看点在于把模型选择与多软件流程隐藏在Agent背后,降低视频生产门槛。 第八条:3D方向两则,轻量几何先验+“体素对齐”前馈3DGS 交大/剑桥提出Evo-0,用隐式3D几何先验强化VLA空间理解,称在无深度输入下提升成功率;浙大VolSplat团队提出“体素对齐”替代传统像素对齐,改善多视角三维融合与渲染鲁棒性。 第九条:马斯克第六次起诉OpenAI:指控“挖角+窃取商业机密” xAI在加州北区联邦法院提起新诉,指OpenAI诱导核心员工泄密、获取数据中心战略与源代码;OpenAI否认并称属“持续骚扰”。事件升级将继续影响两家在顶尖人才与算力生态的竞争格局。 第十条:行业碎片化观察,苹果内测“Veritas”服务Siri重构、YouTube音乐上新AI主播 据报道,苹果以内部聊天机器人为Siri大改版做能力测试;YouTube音乐试AI主播“Beyond the Beat”,在播放中插入故事与趣闻,探索“内容+讲述”的AI化听觉体验。 今天就到这里,感谢收听,我们明天见。
2025年9月28日 每天5min了解前沿AI动态欢迎收听AI一日谈。大家好!我是Frankie。以下是今天最值得关注的十条新闻。 第一条:快手发了“会写代码的Agentic模型” 快手旗下 Kwaipilot 团队发布 KAT 系列:KAT-Dev-32B(开源)与 KAT-Coder(闭源),在 SWE-Bench Verified 上分别做到 62.4% 和 73.4% 的解决率,主打“面向真实工程修复”的智能代理能力。工程同学可以把它当成「带手把手修Bug」的搭档来试试。 第二条:腾讯开源混元图像 3.0 腾讯宣布推出并开源新一代多模态图像生成模型 Hunyuan Image 3.0,强调复杂语义理解、长提示词解析,以及“工业级可用”的生成质量与时延表现,面向内容生产与行业场景落地。 第三条:苹果在内测“类 ChatGPT”应用,Siri 要大改版 据报道,苹果正在测试一款类似 ChatGPT 的 iPhone 应用,用来推动 Siri 的重大升级:更强的检索与操作、更自然的语音理解,未来可能把相册编辑、歌曲查找这类任务做得更顺手。 第四条:Gemini 2.5 Flash Lite 更新,主打“更快” 谷歌给 Flash/Flash Lite 做了性能升级。AIbase援引第三方评测称,Flash Lite 输出速度达每秒约 887 tokens,侧重效率/成本的轻量场景;对做实时产品的团队,是一条不错的「提速」路线。 第五条:苹果新图像模型 Manzano 亮相论文:理解与生成“两手抓” Manzano 通过混合式图像分词器,在理解与生成任务上同时发力,论文与低清样例已放出,目标是缩小开源与商用系统在“复杂文字+图像”任务上的差距。 第六条:YouTube Music 测试 AI 主播功能,正面迎战 Spotify AI DJ 新功能会在播歌时讲“曲目背后的故事/小彩蛋”,提升陪伴感与留存;目前仍是小范围测试,但音乐类平台“AI化”节奏继续加速。 第七条:Moondream 3.0 发表,主打轻量化视觉推理 采用高效 MoE 架构、仅激活约 2 亿参数,在多项基准上据称超越主流顶尖模型;支持开放词表目标检测、结构化输出,适合边缘部署与多场景落地。 第八条:奔驰在华押注“AI新星”,入股重庆千里科技 据 36氪英文站,奔驰成为这家自动驾驶/智能座舱赛道新秀的第五大股东,继续加码“智能电动化+软件定义”路线。对国内汽车供应链的 AI 能力,是一针强心剂。 第九条 Robotaxi 的“眼睛”升级:激光雷达迭代潮来了 量子位报道新一代数字化激光雷达平台在恶劣天气的抗噪、可靠性与成本上同步进化,头部玩家加速换代;业内预计未来 2–3 年是万台到十万台规模化的关键窗口。 第十条 Anthropic 要在海外“大扩军” AIbase称,Anthropic 计划在 2025 年前把国际员工规模翻倍、应用 AI 团队扩大五倍;其使用量近 80% 来自美国以外市场,亚洲与欧洲增长明显。这释放出两点信号:企业级落地加速、区域本地化能力成护城河。 今天就到这里。总结一下:AIGC 继续从“酷炫Demo”走向“工程可用”,大模型轻量化与速度赛跑仍是主线;产业侧,车、音娱、手机操作系统都在做“AI原生体验”的拼图;资本与生态层面,国际化与本地化同步发力。 感谢收听,我们明天见。
2025年9月27日 每天5min了解前沿AI动态欢迎收听AI一日谈。大家好!我是Frankie。我们一起快速扫下今天最值得关注的几条新闻。 先从今天最受关注的一条开始。谷歌 DeepMind 把“会想的机器人”往前推了一大步,发布了 Gemini Robotics 1.5 系列:GR-ER 1.5 负责高层推理、规划与进度监控,GR 1.5 直接把多模态理解变成动作输出。官方展示了跨平台“零样本迁移”:在 ALOHA 上学的技能无缝迁到 Franka、再到类人形 Apollo;并宣称在 230 项任务上全面提升,且在 ASIMOV-2.0 安全基准更稳健。开发者已可在 Google AI Studio 通过 Gemini API 使用 GR-ER 1.5,而 GR 1.5 暂只向少量合作伙伴开放。如果这套“规划+执行”的双模型闭环真能稳定跑在更多第三方硬件上,机器人通用化的门槛会被显著压低,但跨设备、跨场景的第三方复现实证还需要时间。 腾讯混元团队抛出一个少见但很“工程化”的方向:原生 3D 组件生成。今天公开的 Hunyuan3D-Part 由两部分组成:原生 3D 分割模型 P3-SAM 和工业级组件生成 X-Part。团队不仅释出代码与权重,还给了体验入口,强调“先按部件拆,再按部件生”的生产级链路,对游戏资产管线与 3D 打印都更友好。技术细节里,P3-SAM基于大规模 3D 部件监督训练,并构建了 370 万级别的部件掩码数据;X-Part 则用包围盒提示与特征扰动做结构一致的形状分解。这类“可分、可控、可编辑”的 3D 生成比“一体化网格”更贴近产业落地。 检索增强生成 RAG 方向也有新招。来自北航、北大与中关村实验室的 DRAG(Lexical Diversity-aware RAG)提出把“词汇多样性”显式纳入检索与生成两端:先用 DRA 模块对查询中的不变/可变/补充成分分路打分,再用“风险引导稀疏校准”在生成时只对高风险 token 动态干预。团队称在多个数据集平均准确率提升,尤其在 HotpotQA、2WikiMultiHopQA 上+10.6%,并拿下若干基准 SOTA。对实际产品价值在于“读懂言外之意”的询问与表述变体,但也要留意不同基座模型迁移的一致性。 对齐方向今天也有一条“训练时零改动”的方法引发讨论:Token-Aware Editing(TAE)。核心思路是用互信息引导的图聚合找更准确的编辑方向,再在推理时按 token 的“错位风险”自适应调整干预强度,做到“该推就推、能不动就不动”。作者在 TruthfulQA 上报告相对原始基线真实性指标提升 25.8%,且优于既有编辑方法;毒性与偏见指标也显著改善。方法即插即用、训练零改动的属性,对生产系统尝鲜的门槛很低,但在复杂开放域对话里的长期副作用与风格漂移仍需观察。 更“底层”的一则:SGLang 团队联合清华 THUDM 的 slime 团队,宣布开源了“100% 可复现”的稳定 RL 训练路径,并把 LLM 推理里的不确定性几乎清零,给出“两次运行曲线完全重合”的复现实例。实现点包括批次不变算子、确定性采样种子、与分块预填充、CUDA Graph、Radix Cache 的兼容;代价是非确定性模式下约三成的性能损失(文中测得平均 ~34.35%)。对于做在线/闭环强化学习与需要高可信 A/B 的团队,这是把“可复现”从口号落到工程的一步,但在极限吞吐与 MoE 支持上还有路要走。 大模型应用侧,Kimi 推出名为“OK Computer”的 Agent 模型,量子位今天做了一轮上手:能搭网站、做 PPT、跑数据分析,还展示了过程可观测的 Todo 与自检。对普通用户,这类“可见的任务分解+自动素材搜集/生成”会是入门门槛很低的形态;对企业侧,则取决于它的工具生态、数据权限与合规边界。 资本与方法论层面,Thinking Machines(外界常以“OpenAI 前 CTO Mira Murati 创立实验室”标签称呼)今天被量子位追踪了它的第二篇论文:提出“Modular Manifolds”,试图把离散操作放进“近似连续的状态空间”,以便在显存压力更小的前提下拓展自回归建模的可扩展性。这与其前作“克服 LLM 推理不确定性”的工程路线相呼应,指向“为更强推理能力做系统工程”的长期主线。 国内大厂的 Agent 平台之争也在升温。36 氪今天从云栖大会延伸报道:阿里云百炼发布高代码框架 ModelStudio-ADK,强调“从预定义编排转向自主决策/循环执行”,并打包了工具调用、记忆、RAG、沙箱、全链路可观测与与支付宝合作的支付通道等“企业级七件套”。“高代码+低代码”双轨思路,意在让 Demo 能跨过“跑进生产”的那道坎。对企业听众而言,评估重点会是它与现有 IT 系统的耦合成本、可观测与回滚安全网,以及异构模型/私有化部署的运维复杂度。 宏观科技进展里还有一条:我国在 03:28 用长征四号丙成功发射风云三号 08 星(H 星),定位于极轨业务卫星,侧重气候变化监测,搭载 9 台遥感载荷。这意味着数值预报、气象减灾、气候研究的上游观测将再加一颗“眼睛”,对下游诸如农业、能源与保险定价的 AI 模型训练都是长期利好。 最后是一条可能引发争议的投融资消息。36 氪欧洲站今日刊文称,多方消息显示,ASML 参与了对 Mistral AI 的最新一轮融资,这轮 C 轮规模或达 17 亿欧元;舆论一边认为“光刻龙头+开源大模型”是战略协同,另一边担心供应链与地缘风险的叠加敞口,欧洲监管的态度也会被持续放大镜审视。考虑到消息仍在“来源称/报道称”的阶段,保留观望是理性选择。 以上是今天AI一日谈的十条快讯:从具身智能的“规划+执行”双模闭环,到 3D 原生组件生成的产业化范式。每天我都会精选AI与科技公司最新动态,帮你在碎片化的信息流中,抓住最值得关注的趋势与观点。感谢收听,我们明天见。
2025年9月26日 每天5min了解前沿AI动态欢迎收听AI一日谈。大家好!我是Frankie。我们一起快速扫下9月26日最值得关注的十条新闻,用五分钟帮你把这个行业脉络梳顺。 第一条,OpenAI抛出一个全新的评测基准GDPval,用“经济价值工作”的真实任务去比对模型与行业专家的表现。36氪的报道里写到,在首版GDPval-v0中,GPT-5(高算力版本)在约40.6%的任务上被评为不输专家,Anthropic的Claude Opus 4.1约为49%,但OpenAI也强调目前只覆盖了部分职业场景,后续会扩展流程化、交互式工作链路。对于“模型要不要替代人”的讨论,这更像是一份“离目标还有多远”的里程碑。 第二条,清华自动化系团队发布面向医疗信息学的全自主科研框架“OpenLens AI”,号称能从文献检索到可投稿论文“零人工”跑通全链路,并把科研周期从“月级”压缩到“小时级”。系统由主管、文献综述者、数据分析者、编码器、LaTeX写作器五个智能体协作完成,强调可追溯与质量控制。这类“自动化研究员”路线,正在从口号走向工程化。 第三条,华为诺亚方舟实验室的多模态推理加速算法ViSpec入选NeurIPS 2025,主打“在不牺牲生成质量的前提下,让VLM推理加速最高3.2倍”。如果持续落地到端侧和车端,多模态交互的“流畅度”会是很直观的用户红利。 第四条,医学影像顶会MICCAI的最高荣誉“持久影响力奖”(EIA)今年由华人科学家、联影智能联席CEO沈定刚获得。报道回顾了其在深度学习医学影像方向的长期贡献与引用影响,这一奖项每年仅颁给一位在领域长期产生深远影响的学者。 第五条,地平线宣布通过“先旧后新”的配股方式募资,净得约58亿港元,明确将加码Robotaxi相关投入。结合其与哈啰出行的战略合作与L4全栈方案,这笔资金被视为“冲刺无人化商业闭环”的弹药补给。 第六条,京东物流发布“超脑大模型2.0”与具身智能机械臂“异狼”。官方口径称,2.0版本走向Agentic自主决策,能把千万级变量的规划求解压到2小时内,并在一线作业效率、标准化水平和人机协同上带来两位数提升;“异狼”针对非标包裹自动码笼,强调“感知-决策-执行-进化”的闭环。对供应链自动化,这是把大模型从“数字脑”推到“机械手”的典型尝试。 第七条,ChatGPT的“晨报式”主动服务今天刷屏:国内多家媒体的日更汇总里提到,Pro用户已能体验到无需提问就推送个性化简报的更新。无论你把它看作“Agent先手”还是“信息闹钟”,这一步意味着从“问答式AI”迈向“持续服务式AI”。 第八条,谷歌发布了机器人方向的最新“大脑”模型Gemini Robotics 1.5,侧重更强的“思考/协作”与跨形态学习。若后续在真实机器人平台验证足够稳,这会把“具身智能”的话题从演示视频推到更多垂直场景的可用性讨论。 第九条,OpenAI两位核心负责人接受最新采访,明确“终极目标是自动化研究员”,也谈到在评估趋于饱和后如何“破圈”的思路:让系统更加面向复杂真实任务、与外部工具协作,并接受来自现实世界的反馈。这与今天GDPval基准的推出,彼此呼应。 第十条,机器人学习再添一把火:清华与上海AI Lab联合工作被媒体以“缺数据也能拿SOTA?破解机器人RL两大瓶颈”为题报道,强调端到端在线训练方案在样本效率与稳定性上的进展。对工业端的机器人落地来说,“少标注、快收敛”的方向极具吸引力。 以上就是今天AI一日谈的十条快讯。把它们串起来,主线很清晰:一边是“自动化研究员”从评测到工具链的合围,一边是“具身智能”在物流和机器人上加速落地。每天我都会精选AI与科技公司最新动态,帮你在碎片化的信息流中,抓住最值得关注的趋势与观点。感谢收听,我们明天见。
2025年9月25日 每天5min了解前沿AI动态欢迎收听AI一日谈。大家好!我是Frankie。每天我会精选AI与科技公司最新动态,帮你在碎片化的信息流中,抓住最值得关注的趋势与观点。接下来是今天最值得关注的十条新闻。 第一条:OpenAI 的算力版图继续扩张:官方确认下一阶段的数据中心与能耗路线,目标是把 “Stargate” 级别的 AI 基建继续做大。媒体同时报道了美国多地新建与升级的五个数据中心布局,传出更激进的资本开支和上电目标。要点是两件事:一,模型迭代逼着供给侧重构;二,电力与散热是决定性变量,不只是 GPU 数量。对开发者和企业,这意味着算力价格与可用性都会影响你明年的 Roadmap。 第二条:微软把 Anthropic 的 Claude 模型引入 Microsoft 365 Copilot 与 Copilot Studio,正式走向“多模型”栈。今天多家媒体与官方同步强调:企业可在研究类智能体 Researcher 和自建 Agent 场景中,按需选择 Claude Sonnet 4 与 Opus 4.1,与 OpenAI 模型并行使用。行业含义很直接:A/B 测试不同模型的性价比、时延与“深推理”能力,将成为企业级应用的新常态。 第三条:Meta FAIR 团队发布并开源“代码世界模型” CWM(32B 开源权重),主打“在代码世界里理解—生成—自测—自修”的全链路。相比传统 Code LLM,它强调对“具有状态的代码生态”的世界建模,能让自动化修复和工具调用更稳定。对于工程团队,这类模型可能更适合长周期的代码维护与 CI/CD 集成,而不仅是“写段函数”。 第四条:英伟达将 Audio2Face 面部动画技术开源:从音频直接驱动 ARKit 风格的表情曲线与唇形同步,且能表达情绪强弱。官方博客与开发者论坛、媒体评测都提到:开放 SDK 与样例后,游戏与 3D 生产管线(Maya/UE 插件等)接入成本会下降。对内容行业,这是“数字人”生产力工具链真正走向大众化的一步。 第五条:京东健康发布“AI 普惠医疗加速计划”,推出“AI 医院 1.0”“景医千寻 2.0”等产品矩阵,给出了基层到三甲的落地路径与评测闭环。看点在两个方向:一是智能导诊与影像质控的覆盖深度,二是从“工具”走向“科室—医院—区域”的体系化部署。对医院管理者,这是“算力—数据—质控—支付”联动的试金石。 第六条:联想“天禧”生态官宣与字节“扣子”平台合作:面向个人与企业场景的 AI 助手将更易在天禧生态里被“装配”“分发”,并与扣子的开发能力与服务市场打通。翻译成人话:你的专用 Agent 有望更快从“个人玩具”进化为“企业内、外部双端可用”的组件。对国产生态,这是一次平台级拼装能力的合纵。 第七条:生数科技 Vidu Q2 全球发布,强调“从生成视频到生成演技”:核心在更细腻的微表情、自然运镜与更强语义对齐,并提供“闪电/电影大片”两档生成模式。对于广告与短片制作,这意味着“可用镜头”从“能看”走向“能演”。在与同类视频模型的对比中,Vidu 正把“情感—表演”变成可量化的卖点。 第八条:京东在 JDD 大会上发布面向 C 端的 AI 数字人助手“他她它”:现场演示通过“万能博士”语音下单外卖,强调“拟人交互 + 一键串接京东全域服务”。如果说上一代助手停在对话框,这一代在“表情、动作、情境感知 + 工具链调度”上更像真人“搭子”。这类产品真正的挑战,是持续稳定的服务编排与风控。 第九条:同场加映:京东还发布三款面向个人的 AI 应用——“京犀”“他她它”“JoyInside 2.0”。组合拳的意图很清晰:把“通用助手 + 垂直智能体 + 终端内嵌”做成闭环,让“买、用、管”的场景在一个生态内完成。对友商的启示是:单点体验很难打动用户,必须走向“场景—服务—支付”的多线程协同。 第十条:火山引擎发布“炉米 Lumi”平台,开放同源视觉大模型的 LoRA 微调能力,已支持豆包、即梦等,主打企业级视觉风格定制与 AIGC 生产线接入。要害在“轻量化 + 模块化”的成本结构,让品牌的风格统一与多端分发真正落地。对于乙方团队,这是“把风格当产能”的一条新流水线。 今天我们看到三股合流的趋势越来越清晰:第一,基础设施继续上大强度,给模型演进铺路;第二,平台全面“多模型化”,企业开始把模型当“可替换零件”管理;第三,内容与应用侧把“可用性”和“情感表达”作为新护城河。你会优先下注哪一条?欢迎在评论区告诉我们。感谢收听,我们明天见。
2025年9月24日 每天5min了解前沿AI动态欢迎收听AI一日谈。大家好!我是Frankie,今天是2025年9月24日。每天我会精选AI与科技公司最新动态,帮你在碎片化的信息流中,抓住最值得关注的趋势与观点。接下来是今天最值得关注的十条新闻。 第一条:OpenAI官宣在全球新增五个超大规模数据中心选址,代号“Stargate”的算力布局持续扩张。36氪梳理显示,这批新址来自OpenAI官网更新与多方报道交叉确认,外界最关心两点:其一是如何筹措海量前期资本开支,其二是对上游GPU与电力的拉动会否进一步加剧“算力荒”。与此同时,英伟达与OpenAI的深度绑定也被再次放大解读。 第二条:阿里云与英伟达在云栖大会宣布“Physical AI(物理AI)”合作,PAI平台将集成Isaac Sim、Isaac Lab、Cosmos等全栈工具链,面向具身智能、自动驾驶等场景提供从合成数据、训练到仿真测试的一体化能力。落点非常具体:更快把机器人与真实世界“对齐”。这意味着国内云厂商与GPU巨头的协同从“模型时代”走向“系统与场景时代”。 第三条:阿里巴巴CEO吴泳铭在云栖大会演讲中强调“三年3800亿元AI基建计划”正在推进,并提出“AGI是确定性,终点是ASI”的路线图;但同台的阿里云CTO周靖人也泼了“冷静的水”:实现ASI仍有众多系统性难题要攻克,需从训练范式、模型结构到与世界交互的自学习链条上整体演进。这种“雄心与克制并存”的信号,给行业提供了难得的现实参照。 第四条:2025骁龙峰会·中国开幕。高通启动“AI加速计划”,并由CEO安蒙总结AI未来六大趋势:从“AI即新UI”、到“以智能体为中心”的生态、再到“云—端混合模型”的协同与6G感知网络。对国内安卓生态与边缘设备厂商,这是一次“路线图级”的对齐时刻。 第五条:通义Qwen在云栖大会“七连发”。重点包括:万亿级Qwen3-Max正式版本(分Instruct/Thinking),思考版在AIME’25与HMMT数学评测拿到满分;视觉模型Qwen3-VL开源并升级动态分辨率与时序建模;全模态Qwen3-Omni家族、LiveTranslate同传模型、Qwen3-Coder-Plus与图像编辑新能力齐上阵,甚至预告了高效MOE架构Qwen3-Next。无论开源生态还是产品落地,都是一套“能力矩阵”的展示。 第六条:夸克推出“造点AI”创作平台,整合通义万相Wan2.5与Midjourney V7,主打“会中文、懂东方审美”的图像与音画同生成工具。这不是又一个“图片App”,而是把更复杂的生成工作流打包给普通用户,降低了从灵感到成片的门槛。 第七条:Google上线实验性创意工具Mixboard(被媒体昵称为“AI画板”)。它支持以模板与文本提示快速生成情绪板、灵感板,并可一键再生成与编辑。对于设计、活动策划、家装等轻创意场景,是一类“前期探索效率乘法器”。 第八条:1688发布面向跨境中小商家的智能体“遨虾”,启动内测。给定目标商品链接,系统用视觉与语义检索在中国工厂中找“可生产的相似款”,并同时处理认证合规、最小起订量与多语种文案,这相当于把选品—寻源—合规这段“重人工”的链路压到分钟级。B2B电商的AI化,开始从工具层迈入流程重构。 第九条:外交部介绍《“人工智能+”国际合作倡议》:聚焦民生福祉、科技进步、产业应用、文化繁荣、人才培养五大方向,倡导在“相互尊重、互利共赢”原则下推进政策沟通与务实合作。对正在加速“AI出海”的产业与学研界,这是一个值得对齐的对外沟通框架。 第十条:二级市场侧的回响:在“云栖+算力+模型”多重催化下,AI主题ETF盘中再创历史新高。这既反映了资金对“产业链三段位”(算力—模型—应用)共振的定价,也提醒大家警惕情绪与基本面的错位,关注真正具备“应用闭环”的公司与赛道。 以上就是今天的AI一日谈。你会发现,叙事正在从“单点模型突破”转向“系统与场景合奏”,从发布会走向流程与产业的重写。也欢迎把你最感兴趣的一条私信给我们,下一期就从你的问题开聊。感谢收听,拜拜。