【本期主题】
2025年9月23日凌晨,阿里云深夜放大招,发布并开源Qwen3系列新模型!全模态Qwen3-Omni、文本转语音Qwen3-TTS、图像编辑Qwen-Image-Edit-2509组成三板斧,直指多模态交互、本地化语音及创意设计核心场景。本期深度拆解各模型亮点,更有上手实测后的真实评价。
【核心看点】
- Qwen3-Omni为何敢称原生全模态?1个模型处理音视频文本,如何做到不降智?
- 语音能力能对标Gemini?Qwen3-Omni在22项音视频测试中拿SOTA,多语言支持有多全面?
- Qwen3-TTS的王牌是方言?17种音色+8种中国方言,能解决创作者哪些痛点?
- Qwen-Image-Edit-2509敢对标谷歌Nano Banana?多图融合与编辑一致性有何突破?
- 实测效果打几分?官方宣传与实际体验有差距?模型还需打磨哪些问题?
【主播信息】
软件和人工智能专家,程序员,已申请数十项技术专利。连续创业者,历任多家公司CTO,AI畅销书《DeepSeek全场景指南》《学会提问,驾驭AI:提示词从入门到精通》作者,C哥的AI成长圈主理人,助力众多企业及个人落地AI实践。
