AI一日谈 | 小宇宙 - 听播客，上小宇宙

5已订阅

AI一日谈

AI一日谈

单集更新

节目详情

2025年9月30日每天5min了解前沿AI动态
大家好，欢迎收听今天的AI一日谈。今天是9月30日，我将带你快速扫过国内外最热的AI与前沿科技动态。废话不多说，直接开整。第一条：Claude Sonnet 4.5 登场 Anthropic发布新一代Claude Sonnet 4.5，强调“长时间连续编程”和大规模代码生成能力，行业关注点在于其对开发者工作流与智能体编排的提升空间。多模态理解与复杂任务的“长链路稳定性”成看点。第二条：荣耀“阿尔法”线下落地荣耀阿尔法全球旗舰店在深圳湾开业，定位为“AI终端智慧生活创新工坊”。这意味着其从“AI终端生态”战略转向实体化展示与用户体验拉通，品牌也借此建立AI生态的线下枢纽。第三条：Windows 团队重组押注“AI 操作系统” 微软将客户端与服务器工程团队整合，由Pavan Davuluri统筹，目标是加速“AI OS”战略推进。工程组织的“一体化”意味着Windows层面的AI能力与设备生态将更快地打通。第四条：OpenAI 上线家长控制与安全路由 OpenAI宣布在ChatGPT引入“家长控制”和安全路由测试，聚焦敏感对话的安全补全与模型切换机制，减少“幻觉式迎合”的风险点。对普通用户意味着默认安全网进一步加厚。第五条：DeepSeek 升级带动“芯片/科创”行情受DeepSeek V3.2-Exp等模型更新及国产化适配消息刺激，A股“科创50/芯片”等指数走强。市场把“模型升级→算力与半导体链景气度”视作共振主线，观望国庆后持续性。第六条：恒为科技收购AI应用公司引爆股价恒为科技拟以发行股份+现金方式收购数珩科技75%股权，转向下游场景化AI应用。复牌后股价“一字板”，资本市场期待其AI业务的收入与落地确定性。第七条：机器人赛道继续升温宁波立聚动力获乐聚机器人和中大力德入股，业务涵盖芯片设计、智能机器人与AI行业应用集成等。机器人核心零部件与系统集成“链上合纵连横”的趋势更明显。第八条：能源×AI 基建一体化落地道通科技在美国北卡完成首个“充电+储能一体化（EV+BESS）”项目并通过杜克能源审批。对智能出行与电网互动而言，储充一体化正从PPT走向规模化部署。第九条：具身智能再上热搜位 “第二届中关村具身智能机器人应用大赛”开启报名，官方强调“真干活”的落地导向。配合近日多地机器人论坛与展会热度，具身智能正从“演示秀场”迈向“可用工人”。第十条：一线评论视角——“AI狂飙，地基不牢？” 36氪深度稿聚焦甲骨文转向AI基础设施后的巨额投入与现金流压力、数据中心与能源配套的沉重成本，抛出一个直面问题：AI产业化加速期，谁来为“地基工程”买单？以上就是AI一日谈的全部内容了，今天就到这里，感谢收听，我们明天见。
4分钟 · 9个月前
5
0
2025年9月29日每天5min了解前沿AI动态
欢迎收听AI一日谈。大家好！我是Frankie。以下是今天最值得关注的几条新闻。第一条：华为盘古718B跃居开源阵营第二 SuperCLUE最新一期榜单出炉，7180亿参数的MoE模型openPangu-Ultra-MoE-718B在“开源、国产”维度冲到前列；榜单聚焦数学/科学推理、代码、Agent、幻觉控制和指令遵循六维评估。看点是大参数+MoE在综合能力上的稳定性。第二条：HLE“人类最后考试”首破60分，Eigen-1多智能体跑赢GPT-5 耶鲁/上交/UCLA/牛津等团队发布的Eigen-1在HLE Bio/Chem Gold测试集Pass@5达61.74%，首次跨越60分，并宣称超越Gemini 2.5 Pro与GPT-5等闭源大模型；亮点是基于开源DeepSeek V3.1的多智能体协作。第三条：GPT-5被量子计算大牛“点赞”，不到半小时给出关键证明思路 Scott Aaronson在博文中称，GPT-5在量子复杂性理论问题上提供了可教的证明框架，相比一年前同类尝试有明显跃升；再度引发“前沿数学/理论推理是否开始可用”的讨论。第四条：Flash Attention作者Tri Dao预判，NVIDIA三年内不再“统治一切” Tri Dao在最新播客中称，未来2–3年AI硬件会按“传统聊天/极低时延/高吞吐批处理”三类负载走向专用芯片共存，配合MoE、量化与软硬协同，整体推理成本继续走低，生态将多元化。第五条：腾讯研究院发布AIGC普及度报告，使用比例达96.2%，期待与焦虑并存对3570名网民的调研显示，67.7%“每天用AI”，但对职业前景、信息真实性与公平性的担忧显著；“效率赋能—职业焦虑”的双重心态成当下主旋律。第六条：浪潮信息打成本与时延组合拳，百万Token“1块钱”、8.9ms生成在人工智能计算大会上，浪潮信息发布HC1000等新品，宣称把大模型推理成本压到百万Token约1元，并把R1类模型的单Token生成时延拉到毫秒级，直指“智能体产业化三要素”的速度与成本。第七条：商汤Seko上线1个月突破10万创作者，对话式“创编一体”AI短片Agent Seko集成多模态模型，用户“对话到出片”一站式完成；看点在于把模型选择与多软件流程隐藏在Agent背后，降低视频生产门槛。第八条：3D方向两则，轻量几何先验+“体素对齐”前馈3DGS 交大/剑桥提出Evo-0，用隐式3D几何先验强化VLA空间理解，称在无深度输入下提升成功率；浙大VolSplat团队提出“体素对齐”替代传统像素对齐，改善多视角三维融合与渲染鲁棒性。第九条：马斯克第六次起诉OpenAI：指控“挖角+窃取商业机密” xAI在加州北区联邦法院提起新诉，指OpenAI诱导核心员工泄密、获取数据中心战略与源代码；OpenAI否认并称属“持续骚扰”。事件升级将继续影响两家在顶尖人才与算力生态的竞争格局。第十条：行业碎片化观察，苹果内测“Veritas”服务Siri重构、YouTube音乐上新AI主播据报道，苹果以内部聊天机器人为Siri大改版做能力测试；YouTube音乐试AI主播“Beyond the Beat”，在播放中插入故事与趣闻，探索“内容+讲述”的AI化听觉体验。今天就到这里，感谢收听，我们明天见。
5分钟 · 9个月前
3
0
2025年9月28日每天5min了解前沿AI动态
欢迎收听AI一日谈。大家好！我是Frankie。以下是今天最值得关注的十条新闻。第一条：快手发了“会写代码的Agentic模型” 快手旗下 Kwaipilot 团队发布 KAT 系列：KAT-Dev-32B（开源）与 KAT-Coder（闭源），在 SWE-Bench Verified 上分别做到 62.4% 和 73.4% 的解决率，主打“面向真实工程修复”的智能代理能力。工程同学可以把它当成「带手把手修Bug」的搭档来试试。第二条：腾讯开源混元图像 3.0 腾讯宣布推出并开源新一代多模态图像生成模型 Hunyuan Image 3.0，强调复杂语义理解、长提示词解析，以及“工业级可用”的生成质量与时延表现，面向内容生产与行业场景落地。第三条：苹果在内测“类 ChatGPT”应用，Siri 要大改版据报道，苹果正在测试一款类似 ChatGPT 的 iPhone 应用，用来推动 Siri 的重大升级：更强的检索与操作、更自然的语音理解，未来可能把相册编辑、歌曲查找这类任务做得更顺手。第四条：Gemini 2.5 Flash Lite 更新，主打“更快” 谷歌给 Flash/Flash Lite 做了性能升级。AIbase援引第三方评测称，Flash Lite 输出速度达每秒约 887 tokens，侧重效率/成本的轻量场景；对做实时产品的团队，是一条不错的「提速」路线。第五条：苹果新图像模型 Manzano 亮相论文：理解与生成“两手抓” Manzano 通过混合式图像分词器，在理解与生成任务上同时发力，论文与低清样例已放出，目标是缩小开源与商用系统在“复杂文字+图像”任务上的差距。第六条：YouTube Music 测试 AI 主播功能，正面迎战 Spotify AI DJ 新功能会在播歌时讲“曲目背后的故事/小彩蛋”，提升陪伴感与留存；目前仍是小范围测试，但音乐类平台“AI化”节奏继续加速。第七条：Moondream 3.0 发表，主打轻量化视觉推理采用高效 MoE 架构、仅激活约 2 亿参数，在多项基准上据称超越主流顶尖模型；支持开放词表目标检测、结构化输出，适合边缘部署与多场景落地。第八条：奔驰在华押注“AI新星”，入股重庆千里科技据 36氪英文站，奔驰成为这家自动驾驶/智能座舱赛道新秀的第五大股东，继续加码“智能电动化+软件定义”路线。对国内汽车供应链的 AI 能力，是一针强心剂。第九条 Robotaxi 的“眼睛”升级：激光雷达迭代潮来了量子位报道新一代数字化激光雷达平台在恶劣天气的抗噪、可靠性与成本上同步进化，头部玩家加速换代；业内预计未来 2–3 年是万台到十万台规模化的关键窗口。第十条 Anthropic 要在海外“大扩军” AIbase称，Anthropic 计划在 2025 年前把国际员工规模翻倍、应用 AI 团队扩大五倍；其使用量近 80% 来自美国以外市场，亚洲与欧洲增长明显。这释放出两点信号：企业级落地加速、区域本地化能力成护城河。今天就到这里。总结一下：AIGC 继续从“酷炫Demo”走向“工程可用”，大模型轻量化与速度赛跑仍是主线；产业侧，车、音娱、手机操作系统都在做“AI原生体验”的拼图；资本与生态层面，国际化与本地化同步发力。感谢收听，我们明天见。
4分钟 · 9个月前
0
0
2025年9月27日每天5min了解前沿AI动态
欢迎收听AI一日谈。大家好！我是Frankie。我们一起快速扫下今天最值得关注的几条新闻。先从今天最受关注的一条开始。谷歌 DeepMind 把“会想的机器人”往前推了一大步，发布了 Gemini Robotics 1.5 系列：GR-ER 1.5 负责高层推理、规划与进度监控，GR 1.5 直接把多模态理解变成动作输出。官方展示了跨平台“零样本迁移”：在 ALOHA 上学的技能无缝迁到 Franka、再到类人形 Apollo；并宣称在 230 项任务上全面提升，且在 ASIMOV-2.0 安全基准更稳健。开发者已可在 Google AI Studio 通过 Gemini API 使用 GR-ER 1.5，而 GR 1.5 暂只向少量合作伙伴开放。如果这套“规划+执行”的双模型闭环真能稳定跑在更多第三方硬件上，机器人通用化的门槛会被显著压低，但跨设备、跨场景的第三方复现实证还需要时间。腾讯混元团队抛出一个少见但很“工程化”的方向：原生 3D 组件生成。今天公开的 Hunyuan3D-Part 由两部分组成：原生 3D 分割模型 P3-SAM 和工业级组件生成 X-Part。团队不仅释出代码与权重，还给了体验入口，强调“先按部件拆，再按部件生”的生产级链路，对游戏资产管线与 3D 打印都更友好。技术细节里，P3-SAM基于大规模 3D 部件监督训练，并构建了 370 万级别的部件掩码数据；X-Part 则用包围盒提示与特征扰动做结构一致的形状分解。这类“可分、可控、可编辑”的 3D 生成比“一体化网格”更贴近产业落地。检索增强生成 RAG 方向也有新招。来自北航、北大与中关村实验室的 DRAG（Lexical Diversity-aware RAG）提出把“词汇多样性”显式纳入检索与生成两端：先用 DRA 模块对查询中的不变/可变/补充成分分路打分，再用“风险引导稀疏校准”在生成时只对高风险 token 动态干预。团队称在多个数据集平均准确率提升，尤其在 HotpotQA、2WikiMultiHopQA 上+10.6%，并拿下若干基准 SOTA。对实际产品价值在于“读懂言外之意”的询问与表述变体，但也要留意不同基座模型迁移的一致性。对齐方向今天也有一条“训练时零改动”的方法引发讨论：Token-Aware Editing（TAE）。核心思路是用互信息引导的图聚合找更准确的编辑方向，再在推理时按 token 的“错位风险”自适应调整干预强度，做到“该推就推、能不动就不动”。作者在 TruthfulQA 上报告相对原始基线真实性指标提升 25.8%，且优于既有编辑方法；毒性与偏见指标也显著改善。方法即插即用、训练零改动的属性，对生产系统尝鲜的门槛很低，但在复杂开放域对话里的长期副作用与风格漂移仍需观察。更“底层”的一则：SGLang 团队联合清华 THUDM 的 slime 团队，宣布开源了“100% 可复现”的稳定 RL 训练路径，并把 LLM 推理里的不确定性几乎清零，给出“两次运行曲线完全重合”的复现实例。实现点包括批次不变算子、确定性采样种子、与分块预填充、CUDA Graph、Radix Cache 的兼容；代价是非确定性模式下约三成的性能损失（文中测得平均 ~34.35%）。对于做在线/闭环强化学习与需要高可信 A/B 的团队，这是把“可复现”从口号落到工程的一步，但在极限吞吐与 MoE 支持上还有路要走。大模型应用侧，Kimi 推出名为“OK Computer”的 Agent 模型，量子位今天做了一轮上手：能搭网站、做 PPT、跑数据分析，还展示了过程可观测的 Todo 与自检。对普通用户，这类“可见的任务分解+自动素材搜集/生成”会是入门门槛很低的形态；对企业侧，则取决于它的工具生态、数据权限与合规边界。资本与方法论层面，Thinking Machines（外界常以“OpenAI 前 CTO Mira Murati 创立实验室”标签称呼）今天被量子位追踪了它的第二篇论文：提出“Modular Manifolds”，试图把离散操作放进“近似连续的状态空间”，以便在显存压力更小的前提下拓展自回归建模的可扩展性。这与其前作“克服 LLM 推理不确定性”的工程路线相呼应，指向“为更强推理能力做系统工程”的长期主线。国内大厂的 Agent 平台之争也在升温。36 氪今天从云栖大会延伸报道：阿里云百炼发布高代码框架 ModelStudio-ADK，强调“从预定义编排转向自主决策/循环执行”，并打包了工具调用、记忆、RAG、沙箱、全链路可观测与与支付宝合作的支付通道等“企业级七件套”。“高代码+低代码”双轨思路，意在让 Demo 能跨过“跑进生产”的那道坎。对企业听众而言，评估重点会是它与现有 IT 系统的耦合成本、可观测与回滚安全网，以及异构模型/私有化部署的运维复杂度。宏观科技进展里还有一条：我国在 03:28 用长征四号丙成功发射风云三号 08 星（H 星），定位于极轨业务卫星，侧重气候变化监测，搭载 9 台遥感载荷。这意味着数值预报、气象减灾、气候研究的上游观测将再加一颗“眼睛”，对下游诸如农业、能源与保险定价的 AI 模型训练都是长期利好。最后是一条可能引发争议的投融资消息。36 氪欧洲站今日刊文称，多方消息显示，ASML 参与了对 Mistral AI 的最新一轮融资，这轮 C 轮规模或达 17 亿欧元；舆论一边认为“光刻龙头+开源大模型”是战略协同，另一边担心供应链与地缘风险的叠加敞口，欧洲监管的态度也会被持续放大镜审视。考虑到消息仍在“来源称/报道称”的阶段，保留观望是理性选择。以上是今天AI一日谈的十条快讯：从具身智能的“规划+执行”双模闭环，到 3D 原生组件生成的产业化范式。每天我都会精选AI与科技公司最新动态，帮你在碎片化的信息流中，抓住最值得关注的趋势与观点。感谢收听，我们明天见。
8分钟 · 9个月前
0
0
2025年9月26日每天5min了解前沿AI动态
欢迎收听AI一日谈。大家好！我是Frankie。我们一起快速扫下9月26日最值得关注的十条新闻，用五分钟帮你把这个行业脉络梳顺。第一条，OpenAI抛出一个全新的评测基准GDPval，用“经济价值工作”的真实任务去比对模型与行业专家的表现。36氪的报道里写到，在首版GDPval-v0中，GPT-5（高算力版本）在约40.6%的任务上被评为不输专家，Anthropic的Claude Opus 4.1约为49%，但OpenAI也强调目前只覆盖了部分职业场景，后续会扩展流程化、交互式工作链路。对于“模型要不要替代人”的讨论，这更像是一份“离目标还有多远”的里程碑。第二条，清华自动化系团队发布面向医疗信息学的全自主科研框架“OpenLens AI”，号称能从文献检索到可投稿论文“零人工”跑通全链路，并把科研周期从“月级”压缩到“小时级”。系统由主管、文献综述者、数据分析者、编码器、LaTeX写作器五个智能体协作完成，强调可追溯与质量控制。这类“自动化研究员”路线，正在从口号走向工程化。第三条，华为诺亚方舟实验室的多模态推理加速算法ViSpec入选NeurIPS 2025，主打“在不牺牲生成质量的前提下，让VLM推理加速最高3.2倍”。如果持续落地到端侧和车端，多模态交互的“流畅度”会是很直观的用户红利。第四条，医学影像顶会MICCAI的最高荣誉“持久影响力奖”（EIA）今年由华人科学家、联影智能联席CEO沈定刚获得。报道回顾了其在深度学习医学影像方向的长期贡献与引用影响，这一奖项每年仅颁给一位在领域长期产生深远影响的学者。第五条，地平线宣布通过“先旧后新”的配股方式募资，净得约58亿港元，明确将加码Robotaxi相关投入。结合其与哈啰出行的战略合作与L4全栈方案，这笔资金被视为“冲刺无人化商业闭环”的弹药补给。第六条，京东物流发布“超脑大模型2.0”与具身智能机械臂“异狼”。官方口径称，2.0版本走向Agentic自主决策，能把千万级变量的规划求解压到2小时内，并在一线作业效率、标准化水平和人机协同上带来两位数提升；“异狼”针对非标包裹自动码笼，强调“感知-决策-执行-进化”的闭环。对供应链自动化，这是把大模型从“数字脑”推到“机械手”的典型尝试。第七条，ChatGPT的“晨报式”主动服务今天刷屏：国内多家媒体的日更汇总里提到，Pro用户已能体验到无需提问就推送个性化简报的更新。无论你把它看作“Agent先手”还是“信息闹钟”，这一步意味着从“问答式AI”迈向“持续服务式AI”。第八条，谷歌发布了机器人方向的最新“大脑”模型Gemini Robotics 1.5，侧重更强的“思考/协作”与跨形态学习。若后续在真实机器人平台验证足够稳，这会把“具身智能”的话题从演示视频推到更多垂直场景的可用性讨论。第九条，OpenAI两位核心负责人接受最新采访，明确“终极目标是自动化研究员”，也谈到在评估趋于饱和后如何“破圈”的思路：让系统更加面向复杂真实任务、与外部工具协作，并接受来自现实世界的反馈。这与今天GDPval基准的推出，彼此呼应。第十条，机器人学习再添一把火：清华与上海AI Lab联合工作被媒体以“缺数据也能拿SOTA？破解机器人RL两大瓶颈”为题报道，强调端到端在线训练方案在样本效率与稳定性上的进展。对工业端的机器人落地来说，“少标注、快收敛”的方向极具吸引力。以上就是今天AI一日谈的十条快讯。把它们串起来，主线很清晰：一边是“自动化研究员”从评测到工具链的合围，一边是“具身智能”在物流和机器人上加速落地。每天我都会精选AI与科技公司最新动态，帮你在碎片化的信息流中，抓住最值得关注的趋势与观点。感谢收听，我们明天见。
5分钟 · 9个月前
1
0
2025年9月25日每天5min了解前沿AI动态
欢迎收听AI一日谈。大家好！我是Frankie。每天我会精选AI与科技公司最新动态，帮你在碎片化的信息流中，抓住最值得关注的趋势与观点。接下来是今天最值得关注的十条新闻。第一条：OpenAI 的算力版图继续扩张：官方确认下一阶段的数据中心与能耗路线，目标是把 “Stargate” 级别的 AI 基建继续做大。媒体同时报道了美国多地新建与升级的五个数据中心布局，传出更激进的资本开支和上电目标。要点是两件事：一，模型迭代逼着供给侧重构；二，电力与散热是决定性变量，不只是 GPU 数量。对开发者和企业，这意味着算力价格与可用性都会影响你明年的 Roadmap。第二条：微软把 Anthropic 的 Claude 模型引入 Microsoft 365 Copilot 与 Copilot Studio，正式走向“多模型”栈。今天多家媒体与官方同步强调：企业可在研究类智能体 Researcher 和自建 Agent 场景中，按需选择 Claude Sonnet 4 与 Opus 4.1，与 OpenAI 模型并行使用。行业含义很直接：A/B 测试不同模型的性价比、时延与“深推理”能力，将成为企业级应用的新常态。第三条：Meta FAIR 团队发布并开源“代码世界模型” CWM（32B 开源权重），主打“在代码世界里理解—生成—自测—自修”的全链路。相比传统 Code LLM，它强调对“具有状态的代码生态”的世界建模，能让自动化修复和工具调用更稳定。对于工程团队，这类模型可能更适合长周期的代码维护与 CI/CD 集成，而不仅是“写段函数”。第四条：英伟达将 Audio2Face 面部动画技术开源：从音频直接驱动 ARKit 风格的表情曲线与唇形同步，且能表达情绪强弱。官方博客与开发者论坛、媒体评测都提到：开放 SDK 与样例后，游戏与 3D 生产管线（Maya/UE 插件等）接入成本会下降。对内容行业，这是“数字人”生产力工具链真正走向大众化的一步。第五条：京东健康发布“AI 普惠医疗加速计划”，推出“AI 医院 1.0”“景医千寻 2.0”等产品矩阵，给出了基层到三甲的落地路径与评测闭环。看点在两个方向：一是智能导诊与影像质控的覆盖深度，二是从“工具”走向“科室—医院—区域”的体系化部署。对医院管理者，这是“算力—数据—质控—支付”联动的试金石。第六条：联想“天禧”生态官宣与字节“扣子”平台合作：面向个人与企业场景的 AI 助手将更易在天禧生态里被“装配”“分发”，并与扣子的开发能力与服务市场打通。翻译成人话：你的专用 Agent 有望更快从“个人玩具”进化为“企业内、外部双端可用”的组件。对国产生态，这是一次平台级拼装能力的合纵。第七条：生数科技 Vidu Q2 全球发布，强调“从生成视频到生成演技”：核心在更细腻的微表情、自然运镜与更强语义对齐，并提供“闪电/电影大片”两档生成模式。对于广告与短片制作，这意味着“可用镜头”从“能看”走向“能演”。在与同类视频模型的对比中，Vidu 正把“情感—表演”变成可量化的卖点。第八条：京东在 JDD 大会上发布面向 C 端的 AI 数字人助手“他她它”：现场演示通过“万能博士”语音下单外卖，强调“拟人交互 + 一键串接京东全域服务”。如果说上一代助手停在对话框，这一代在“表情、动作、情境感知 + 工具链调度”上更像真人“搭子”。这类产品真正的挑战，是持续稳定的服务编排与风控。第九条：同场加映：京东还发布三款面向个人的 AI 应用——“京犀”“他她它”“JoyInside 2.0”。组合拳的意图很清晰：把“通用助手 + 垂直智能体 + 终端内嵌”做成闭环，让“买、用、管”的场景在一个生态内完成。对友商的启示是：单点体验很难打动用户，必须走向“场景—服务—支付”的多线程协同。第十条：火山引擎发布“炉米 Lumi”平台，开放同源视觉大模型的 LoRA 微调能力，已支持豆包、即梦等，主打企业级视觉风格定制与 AIGC 生产线接入。要害在“轻量化 + 模块化”的成本结构，让品牌的风格统一与多端分发真正落地。对于乙方团队，这是“把风格当产能”的一条新流水线。今天我们看到三股合流的趋势越来越清晰：第一，基础设施继续上大强度，给模型演进铺路；第二，平台全面“多模型化”，企业开始把模型当“可替换零件”管理；第三，内容与应用侧把“可用性”和“情感表达”作为新护城河。你会优先下注哪一条？欢迎在评论区告诉我们。感谢收听，我们明天见。
6分钟 · 9个月前
2
0
2025年9月24日每天5min了解前沿AI动态
欢迎收听AI一日谈。大家好！我是Frankie，今天是2025年9月24日。每天我会精选AI与科技公司最新动态，帮你在碎片化的信息流中，抓住最值得关注的趋势与观点。接下来是今天最值得关注的十条新闻。第一条：OpenAI官宣在全球新增五个超大规模数据中心选址，代号“Stargate”的算力布局持续扩张。36氪梳理显示，这批新址来自OpenAI官网更新与多方报道交叉确认，外界最关心两点：其一是如何筹措海量前期资本开支，其二是对上游GPU与电力的拉动会否进一步加剧“算力荒”。与此同时，英伟达与OpenAI的深度绑定也被再次放大解读。第二条：阿里云与英伟达在云栖大会宣布“Physical AI（物理AI）”合作，PAI平台将集成Isaac Sim、Isaac Lab、Cosmos等全栈工具链，面向具身智能、自动驾驶等场景提供从合成数据、训练到仿真测试的一体化能力。落点非常具体：更快把机器人与真实世界“对齐”。这意味着国内云厂商与GPU巨头的协同从“模型时代”走向“系统与场景时代”。第三条：阿里巴巴CEO吴泳铭在云栖大会演讲中强调“三年3800亿元AI基建计划”正在推进，并提出“AGI是确定性，终点是ASI”的路线图；但同台的阿里云CTO周靖人也泼了“冷静的水”：实现ASI仍有众多系统性难题要攻克，需从训练范式、模型结构到与世界交互的自学习链条上整体演进。这种“雄心与克制并存”的信号，给行业提供了难得的现实参照。第四条：2025骁龙峰会·中国开幕。高通启动“AI加速计划”，并由CEO安蒙总结AI未来六大趋势：从“AI即新UI”、到“以智能体为中心”的生态、再到“云—端混合模型”的协同与6G感知网络。对国内安卓生态与边缘设备厂商，这是一次“路线图级”的对齐时刻。第五条：通义Qwen在云栖大会“七连发”。重点包括：万亿级Qwen3-Max正式版本（分Instruct/Thinking），思考版在AIME’25与HMMT数学评测拿到满分；视觉模型Qwen3-VL开源并升级动态分辨率与时序建模；全模态Qwen3-Omni家族、LiveTranslate同传模型、Qwen3-Coder-Plus与图像编辑新能力齐上阵，甚至预告了高效MOE架构Qwen3-Next。无论开源生态还是产品落地，都是一套“能力矩阵”的展示。第六条：夸克推出“造点AI”创作平台，整合通义万相Wan2.5与Midjourney V7，主打“会中文、懂东方审美”的图像与音画同生成工具。这不是又一个“图片App”，而是把更复杂的生成工作流打包给普通用户，降低了从灵感到成片的门槛。第七条：Google上线实验性创意工具Mixboard（被媒体昵称为“AI画板”）。它支持以模板与文本提示快速生成情绪板、灵感板，并可一键再生成与编辑。对于设计、活动策划、家装等轻创意场景，是一类“前期探索效率乘法器”。第八条：1688发布面向跨境中小商家的智能体“遨虾”，启动内测。给定目标商品链接，系统用视觉与语义检索在中国工厂中找“可生产的相似款”，并同时处理认证合规、最小起订量与多语种文案，这相当于把选品—寻源—合规这段“重人工”的链路压到分钟级。B2B电商的AI化，开始从工具层迈入流程重构。第九条：外交部介绍《“人工智能+”国际合作倡议》：聚焦民生福祉、科技进步、产业应用、文化繁荣、人才培养五大方向，倡导在“相互尊重、互利共赢”原则下推进政策沟通与务实合作。对正在加速“AI出海”的产业与学研界，这是一个值得对齐的对外沟通框架。第十条：二级市场侧的回响：在“云栖+算力+模型”多重催化下，AI主题ETF盘中再创历史新高。这既反映了资金对“产业链三段位”（算力—模型—应用）共振的定价，也提醒大家警惕情绪与基本面的错位，关注真正具备“应用闭环”的公司与赛道。以上就是今天的AI一日谈。你会发现，叙事正在从“单点模型突破”转向“系统与场景合奏”，从发布会走向流程与产业的重写。也欢迎把你最感兴趣的一条私信给我们，下一期就从你的问题开聊。感谢收听，拜拜。
6分钟 · 9个月前
1
0

每日精选全球AI与科技公司最新动态，帮你在碎片化的信息流中，抓住最值得关注的趋势与观点。