【AI日报】EP.127 4月3 阿里通义千问登顶全球开源模型榜首；MiniMax推Speech-02语音模型

Aishaobing的个人播客

6分钟 ·1 年前

147

·

0

【AI前沿】阿里通义千问登顶全球开源模型榜首

* Qwen2.5-Omni凭借卓越性能和多模态能力成为全球开源模型第一

* DeepSeek-V3-0324和SpatialLM-Llama-1B紧随其后

* 阿里已开源200款模型推动AI技术普及

【语音技术】MiniMax推出Speech-02语音模型

* 支持30多种语言，语音相似度高达99%

* 新增"Read Anything"功能可上传文件或URL收听内容

* "Long-Text Mode"支持一次性输入20万字符

详情链接：www.minimax.io

【商业动态】ChatGPT付费用户激增至2000万

* 三个月内付费用户突破2000万，年化营收增长30%

* 每周活跃用户达5亿，OpenAI计划融资400亿美元

* 面临Gemini、Claude和Grok等竞争对手挑战

【创新应用】ElevenLabs发布犬类AI语音模型

* "Text To Bark"可将文字转化为高度逼真的狗吠声

* 95%的狗无法分辨声音来源

* 计划扩展至其他动物，探索多模态交互系统

详情链接：elevenlabs.io

【产品更新】腾讯元宝支持多图上传

* 一次性可上传10张图片进行智能处理

* 结合混元多模态理解能力提供连贯分析

* 支持手机版、电脑版和网页版多平台操作

【开源工具】EasyControl_Ghibli模型上线

* 免费生成吉卜力风格图像

* 基于100张真实亚洲面孔照片训练

* 开源特性降低艺术创作门槛

详情链接：huggingface.co

【技术突破】飞桨3.0正式发布

* 引入五大核心技术创新降低大模型开发成本

* 支持60余款主流芯片，适配成本降80%

* 单机部署吞吐量提升高达一倍

【AI测试】GPT-4.5通过图灵测试

* 以73%通过率超越人类表现

* 展现惊人语言自然度和情感丰富性

* 复杂人格扮演机制推动AI应用潜力

详情链接：arxiv.org

【教育平台】OpenAI学院上线

* 提供数十小时免费AI学习材料

* 涵盖基础知识到高级技能课程

* 面向自学者、教育工作者和开发人员

详情链接：academy.openai.com

在小宇宙打开