【AI日报】EP.208 9月30 AI内容新规正式生效;美团推出开源大模型LongCatAishaobing的个人播客

【AI日报】EP.208 9月30 AI内容新规正式生效;美团推出开源大模型LongCat

6分钟 ·
播放数121
·
评论数0

【AI语音】 🎤 阶跃发布Step-Audio 2 mini

* 真端到端语音大模型,SOTA表现

* 融合链式思维推理+强化学习

* 优化情绪、语调等副语言理解

详情链接:github.com

【AI内容新规】 ⚖ 9月1日正式生效

* 强制AI生成内容显式+隐式标识

* 违规将面临限流、整改、下架及法律风险

【开源大模型】 🐱 美团LongCat发布

* 560亿参数,MoE架构

* 推理性能超100 tokens/s

* MMLU、数学推理等任务表现优异

详情链接:longcat.chat

【多模态AI】 🖼️ 上海AI实验室InternVL3.5

* 级联式强化学习+视觉分辨率路由

* 推理与通用性能超越GPT-5、Claude-3.7

详情链接:github.com

【音频生成】 🎧 腾讯ARC AudioStory

* 大语言模型驱动长篇叙事音频

* 结构化生成,音质与一致性俱佳

详情链接:github.com

【语音AI】 🔥 OpenAI GPT-realtime

* 实现自然流畅人机语音对话

* 多模态处理+语音风格切换

【推理优化】 📊 Meta&UCSD DeepConf

* 准确率99.9%,成本降低85%

* “置信度”机制动态优化推理

详情链接:arxiv.org

【科技事件】 🚨 Musk确认xAI代码被盗

* 前员工Xuechen Li转投OpenAI

* 涉及商业机密与巨额利益

【GUI自动化】 📱 阿里巴巴Qwen团队

* Mobile-Agent-v3 & GUI-Owl发布

* 多代理协作+多模态推理,提升GUI任务执行力

详情链接:arxiv.org

【微软AI】 💡 Copilot Labs上线

* 首个实验工具“Copilot音频表达”

* 文本转语音,支持情感+故事模式

详情链接:copilot.microsoft.com

【内容创作】 📝 小红书自动化工具xiaohongshu-mcp

* 支持自动化登录、图文发布、数据获取

* 基于Go语言,开发者友好,支持二次开发

详情链接:github.com