欢迎收听AI一日谈。大家好!我是Frankie。以下是今天最值得关注的十条新闻。
第一条:快手发了“会写代码的Agentic模型”
快手旗下 Kwaipilot 团队发布 KAT 系列:KAT-Dev-32B(开源)与 KAT-Coder(闭源),在 SWE-Bench Verified 上分别做到 62.4% 和 73.4% 的解决率,主打“面向真实工程修复”的智能代理能力。工程同学可以把它当成「带手把手修Bug」的搭档来试试。
第二条:腾讯开源混元图像 3.0
腾讯宣布推出并开源新一代多模态图像生成模型 Hunyuan Image 3.0,强调复杂语义理解、长提示词解析,以及“工业级可用”的生成质量与时延表现,面向内容生产与行业场景落地。
第三条:苹果在内测“类 ChatGPT”应用,Siri 要大改版
据报道,苹果正在测试一款类似 ChatGPT 的 iPhone 应用,用来推动 Siri 的重大升级:更强的检索与操作、更自然的语音理解,未来可能把相册编辑、歌曲查找这类任务做得更顺手。
第四条:Gemini 2.5 Flash Lite 更新,主打“更快”
谷歌给 Flash/Flash Lite 做了性能升级。AIbase援引第三方评测称,Flash Lite 输出速度达每秒约 887 tokens,侧重效率/成本的轻量场景;对做实时产品的团队,是一条不错的「提速」路线。
第五条:苹果新图像模型 Manzano 亮相论文:理解与生成“两手抓”
Manzano 通过混合式图像分词器,在理解与生成任务上同时发力,论文与低清样例已放出,目标是缩小开源与商用系统在“复杂文字+图像”任务上的差距。
第六条:YouTube Music 测试 AI 主播功能,正面迎战 Spotify AI DJ
新功能会在播歌时讲“曲目背后的故事/小彩蛋”,提升陪伴感与留存;目前仍是小范围测试,但音乐类平台“AI化”节奏继续加速。
第七条:Moondream 3.0 发表,主打轻量化视觉推理
采用高效 MoE 架构、仅激活约 2 亿参数,在多项基准上据称超越主流顶尖模型;支持开放词表目标检测、结构化输出,适合边缘部署与多场景落地。
第八条:奔驰在华押注“AI新星”,入股重庆千里科技
据 36氪英文站,奔驰成为这家自动驾驶/智能座舱赛道新秀的第五大股东,继续加码“智能电动化+软件定义”路线。对国内汽车供应链的 AI 能力,是一针强心剂。
第九条 Robotaxi 的“眼睛”升级:激光雷达迭代潮来了
量子位报道新一代数字化激光雷达平台在恶劣天气的抗噪、可靠性与成本上同步进化,头部玩家加速换代;业内预计未来 2–3 年是万台到十万台规模化的关键窗口。
第十条 Anthropic 要在海外“大扩军”
AIbase称,Anthropic 计划在 2025 年前把国际员工规模翻倍、应用 AI 团队扩大五倍;其使用量近 80% 来自美国以外市场,亚洲与欧洲增长明显。这释放出两点信号:企业级落地加速、区域本地化能力成护城河。
今天就到这里。总结一下:AIGC 继续从“酷炫Demo”走向“工程可用”,大模型轻量化与速度赛跑仍是主线;产业侧,车、音娱、手机操作系统都在做“AI原生体验”的拼图;资本与生态层面,国际化与本地化同步发力。
感谢收听,我们明天见。
