欢迎收听AI一日谈。大家好!我是Frankie。以下是今天最值得关注的几条新闻。
第一条:华为盘古718B跃居开源阵营第二
SuperCLUE最新一期榜单出炉,7180亿参数的MoE模型openPangu-Ultra-MoE-718B在“开源、国产”维度冲到前列;榜单聚焦数学/科学推理、代码、Agent、幻觉控制和指令遵循六维评估。看点是大参数+MoE在综合能力上的稳定性。
第二条:HLE“人类最后考试”首破60分,Eigen-1多智能体跑赢GPT-5
耶鲁/上交/UCLA/牛津等团队发布的Eigen-1在HLE Bio/Chem Gold测试集Pass@5达61.74%,首次跨越60分,并宣称超越Gemini 2.5 Pro与GPT-5等闭源大模型;亮点是基于开源DeepSeek V3.1的多智能体协作。
第三条:GPT-5被量子计算大牛“点赞”,不到半小时给出关键证明思路
Scott Aaronson在博文中称,GPT-5在量子复杂性理论问题上提供了可教的证明框架,相比一年前同类尝试有明显跃升;再度引发“前沿数学/理论推理是否开始可用”的讨论。
第四条:Flash Attention作者Tri Dao预判,NVIDIA三年内不再“统治一切”
Tri Dao在最新播客中称,未来2–3年AI硬件会按“传统聊天/极低时延/高吞吐批处理”三类负载走向专用芯片共存,配合MoE、量化与软硬协同,整体推理成本继续走低,生态将多元化。
第五条:腾讯研究院发布AIGC普及度报告,使用比例达96.2%,期待与焦虑并存
对3570名网民的调研显示,67.7%“每天用AI”,但对职业前景、信息真实性与公平性的担忧显著;“效率赋能—职业焦虑”的双重心态成当下主旋律。
第六条:浪潮信息打成本与时延组合拳,百万Token“1块钱”、8.9ms生成
在人工智能计算大会上,浪潮信息发布HC1000等新品,宣称把大模型推理成本压到百万Token约1元,并把R1类模型的单Token生成时延拉到毫秒级,直指“智能体产业化三要素”的速度与成本。
第七条:商汤Seko上线1个月突破10万创作者,对话式“创编一体”AI短片Agent
Seko集成多模态模型,用户“对话到出片”一站式完成;看点在于把模型选择与多软件流程隐藏在Agent背后,降低视频生产门槛。
第八条:3D方向两则,轻量几何先验+“体素对齐”前馈3DGS
交大/剑桥提出Evo-0,用隐式3D几何先验强化VLA空间理解,称在无深度输入下提升成功率;浙大VolSplat团队提出“体素对齐”替代传统像素对齐,改善多视角三维融合与渲染鲁棒性。
第九条:马斯克第六次起诉OpenAI:指控“挖角+窃取商业机密”
xAI在加州北区联邦法院提起新诉,指OpenAI诱导核心员工泄密、获取数据中心战略与源代码;OpenAI否认并称属“持续骚扰”。事件升级将继续影响两家在顶尖人才与算力生态的竞争格局。
第十条:行业碎片化观察,苹果内测“Veritas”服务Siri重构、YouTube音乐上新AI主播
据报道,苹果以内部聊天机器人为Siri大改版做能力测试;YouTube音乐试AI主播“Beyond the Beat”,在播放中插入故事与趣闻,探索“内容+讲述”的AI化听觉体验。
今天就到这里,感谢收听,我们明天见。
