【AI日报】EP.195 8月12 昆仑万维发布SkyReels-A3模型;百度搜索PC端全面上线AI搜索Aishaobing的个人播客

【AI日报】EP.195 8月12 昆仑万维发布SkyReels-A3模型;百度搜索PC端全面上线AI搜索

6分钟 ·
播放数103
·
评论数0

【AI模型】 🤖 昆仑万维发布SkyReels-A3模型,照片可根据语音对口型

* 基于DiT视频扩散模型,实现音频驱动数字人创作

* 可使静态图像或视频中的人物根据语音开口说话或唱歌

* 支持改台词、运镜控制等功能

详情链接: skyworkai.github.io

【AI模型】 🚀 xAI宣布Grok 4 AI模型永久免费开放

* Grok 4人工智能模型将永久免费开放给全球用户

* 提供Auto模式和Expert模式,满足不同用户需求

* 免费开放可能推动AI技术的普及和应用

【行业动态】 📖 OpenAI发布GPT-5提示词指南,解锁AI编程与多模态

* 通过精准的提示设计提升代理任务、代码生成和指令遵循的表现

* 支持生成前端界面、调试大型代码库,并结合Responses API提高效率

* 引入多模态交互功能,包括文本、图像、语音处理

详情链接: cookbook.openai.com

【AI应用】 💻 百度搜索PC端全面上线AI搜索功能

* 新增“超级智能双行框”和“工作台”模块

* 集成AI阅读、AI写作和AI PPT工具,提升用户效率

* 月活跃用户已超过3.22亿,稳居国内AI搜索行业第一

【AI应用】 🖥️ Windows Copilot免费接入GPT-5,使用限制低于ChatGPT

* Windows 11和10的Copilot应用已全面支持GPT-5智能模式

* 用户无需更新即可启用,使用限制比ChatGPT更宽松

* 用户可通过简单步骤免费访问Copilot和GPT-5

【AI模型】 🩺 百川智能开源医疗大模型Baichuan-M2,评测超OpenAI

* 在HealthBench评测中得分60.1,超越OpenAI的gpt-oss120b模型

* 模型经过极致轻量化处理,可在单卡部署,降低成本

* 复杂医疗问题处理能力与GPT-5相当

详情链接: huggingface.co

【行业动态】 📱 苹果宣布GPT-5将集成至iOS26

* iOS26将集成ChatGPT-5模型,提升Apple智能性能

* 新增实时翻译功能,改善跨语言交流体验

* 用户无需OpenAI账户即可使用,关联账户可享更多优惠

【AI框架】 🎨 谷歌推出BlenderFusion,颠覆3D视觉编辑与生成合成

* 集成先进3D编辑工具与扩散模型,实现高效3D视觉编辑与生成

* 工作流程包括分层、编辑和合成三个阶段

* 通过优化模型提升对复杂场景的处理能力

详情链接: blenderfusion.github.io

【AI模型】 🔉 开源轻量级TTS模型Kitten TTS发布,参数量仅1500万

* 开源轻量级文本转语音模型,体积小于25MB,适合各种设备部署

* 支持无GPU运行,可在普通CPU上实现高质量语音合成

* 参数量仅1500万,提供简单安装和使用指南

详情链接: huggingface.co

【AI模型】 📲 MiniCPM-V4.0视觉模型发布,专为移动端优化

* 在OpenCompass评测中得分69.0,超越多款同类模型

* 专为移动设备设计,响应速度快且无发热问题

* 提供开源iOS应用及详细使用指南,便于用户上手

详情链接: huggingface.co

【行业报告】 📈 Stripe报告:AI初创公司营收增速超SaaS三倍

* AI企业营收增长速度远超传统SaaS企业,100万美元年化营收仅需11.5个月

* AI公司从成立之初便具备国际化基因,第一年覆盖国家数量是SaaS企业的两倍

* 按用量计费和按成果计费等商业模式日益流行,推动AI企业快速变现