【本期主题】
9 月 23 日凌晨阿里云深夜放大招,开源三大 AI 模型:全模态 Qwen3-Omni、文本转语音 Qwen3-TTS、图像编辑 Qwen-Image-Edit-2509(对标谷歌 Nano Banana、字节即梦 4.0)!拆解各模型核心亮点 —— 全模态无损耗、49 种音色 + 9 大方言、多图融合编辑,同时揭秘实测短板:与竞品差距明显、效果不稳定,带你看清阿里 AI 三板斧 的真实实力。
【核心看点】
- Qwen3-Omni 有多能打?36 项音视频基准 32 项开源 SOTA,能硬刚 Gemini 2.5 Pro?
- Qwen3-TTS 亮点爆发?49 种音色 + 9 大方言,语音自然度逼近真人?
- 图像编辑对标谷歌 Nano Banana?多图融合 + ControlNet 精细控制,实测翻车了吗?
- 与字节即梦 4.0 差距多大?为何说模型发布着急,还需打磨?
- 三大模型全开源免费?支持本地部署,创作者直接能用?
- Demo 地址在哪?如何上手体验多图编辑、方言语音合成功能?
【主播信息】
软件和人工智能专家,程序员,已申请数十项技术专利。连续创业者,历任多家公司 CTO,AI 畅销书《DeepSeek 全场景指南》《学会提问,驾驭 AI:提示词从入门到精通》作者,C 哥的 AI 成长圈主理人,助力众多企业及个人落地 AI 实践。
