【AI日报】EP.203 8月23 即梦上线智能多帧功能;可灵2.1首尾帧升级;钉钉推语音识别大模型Fun-ASRAishaobing的个人播客

【AI日报】EP.203 8月23 即梦上线智能多帧功能;可灵2.1首尾帧升级;钉钉推语音识别大模型Fun-ASR

5分钟 ·
播放数137
·
评论数0

【AI日报】 📰

【智能助手】🤖 腾讯元宝接入DeepSeek V3.1

* 响应速度显著提升

* 智能助手能力增强,复杂任务处理更高效

* 持续优化产品体验

【视频创作】🎬 即梦AI上线智能多帧功能

* 仅需10张关键帧即可生成54秒连贯长镜头

* 简化视频制作流程,流畅运镜自然过渡

* 提升视觉效果与创作效率

【视频生成】🎥 可灵AI 2.1首尾帧升级

* 效果提升达235%,实现精准可控的起止画面

* 推动广告、影视、短剧与动画创作发展

* 标志AI视频生成迈向专业化

【语音识别】🎤 钉钉&通义实验室发布Fun-ASR

* 高效转写复杂语音,精准识别行业术语

* 支持多语言、多口音识别

* 提供专属模型定制服务

【开发工具】💻 腾讯CodeBuddy IDE国内版公测

* 国内首个支持DeepSeek V3.1的IDE

* 支持全流程自动化编程

* 集成腾讯云EdgeOne Pages

【AI基础设施】🌐 Vercel发布AI Gateway

* 一键调用数百种AI模型,支持OpenAI、xAI、Anthropic等

* 性能优化,低延迟高可靠

* 支持BYOK,成本透明

详情链接: vercel.com

【企业治理】📊 Anthropic整合Claude Code

* 强化AI开发治理能力

* 推出合规API与监控功能

* 优化资源分配与用戶管理

【自动化突破】📱 阿里发布Mobile-Agent-v3

* 跨平台GUI自动化,支持移动与桌面

* GUI-Owl精准识别界面元素

* 开源助力行业创新

详情链接: github.com

【智能编程】👨‍💻 阿里Qoder新一代Agentic Coding平台

* 上下文工程能力强大

* Repo Wiki显性化知识,Quest Mode支持全栈编程

* 变革软件开发模式

详情链接: qoder.com

【3D建模】🕶 清华IDEA团队发布GUAVA

* 单张照片0.1秒生成高质量3D化身

* 引入3D高斯模型,表现力更强

* 推动开源生态与二次开发

详情链接: eastbeanzhang.github.io

【搜索体验】🔍 谷歌搜索新增AI Agent

* 一键预订餐厅,个性化推荐

* 可分享结果,提升互动体验

* 已覆盖180多个国家

【3D创作】🏆 VAST发布Tripo 3.0

* 服务超300万开发者,700+企业采用

* 拥有4000万个高质量3D数据集

* 标志AI 3D建模进入新阶段