【AI日报】EP.198 8月16 可灵2.1推出全新首尾帧功能;昆仑万维上线AI音乐模型Mureka V7.5Aishaobing的个人播客

【AI日报】EP.198 8月16 可灵2.1推出全新首尾帧功能;昆仑万维上线AI音乐模型Mureka V7.5

8分钟 ·
播放数119
·
评论数0

【视频生成】快手可灵2.1推出全新首尾帧功能

*   新增首尾帧功能,提升视频开头和结尾的精细控制

*   支持自定义首尾帧图像,解决转场生硬问题

*   生成速度和成本下降,提高创作者使用效率

【AI音乐】昆仑万维上线AI音乐模型Mureka V7.5

*   在中文歌曲创作中展现卓越能力,包括音色、咬字和情感表现

*   结合MoE-TTS语音合成框架,通过自然语言精准控制声音特征

*   为AI音乐创作和语音合成领域提供了新思路

【AI开发工具】腾讯云推出CloudBase AI CLI,可减少80%编码量

*   提供统一的命令行入口,简化开发流程

*   支持全平台通用性和多模型协作能力

*   提供免费体验额度,降低使用门槛

详情链接: static.cloudbase.net -fsS | bash

【AI Agent】海外新品MuleRun爆火,AI Agent自动玩游戏做建模

*   Al Agent能够自动完成游戏任务,极大提升用户体验

*   为用户提供专属的虚拟机环境,支持运行多种软件和应用

*   社区驱动的Agent生态降低了自动化工具的使用门槛

详情链接: discord.com

【AI视觉】Meta重磅开源DINOv3,无需人工标注

*   基于自监督学习,无需人工标注,从海量图像中自主提取特征

*   高分辨率特征提取,同时捕捉全局信息与局部细节

*   适用于环境监测、医疗、自动驾驶等跨领域应用

详情链接: github.com

【人形机器人】宇树H1夺机器人史首枚1500米金牌

*   在全球首个以人形机器人为核心的竞技赛事中夺得历史首枚1500米赛金牌

*   在软件上针对跑步速度与耐力进行了优化升级,展现了极限性能

【AI助手】谷歌Gemini迎来重大更新,新增记忆功能和隐私聊天模式

*   记忆功能可记录用户偏好和习惯,提升个性化服务体验

*   临时聊天模式保障隐私,对话内容不会被保存或用于训练

*   体现了AI助手在个性化与隐私保护上的双重突破

【开源项目】香港大学联手开源项目OpenCUA,打造个性化电脑智能助手

*   提供无缝的注释基础设施,用于捕捉人类在电脑上的操作演示

*   集成了AgentNet数据集,覆盖超200个应用程序和网站

*   支持可扩展的工作流程,提升长链推理能力

详情链接: opencua.xlang.ai

【行业动态】OpenAI或在ChatGPT引入广告

*   正探索在ChatGPT中引入广告,但需谨慎处理以确保用户体验

*   高管认为订阅模式仍有巨大增长潜力

*   预计2024年订阅收入将达127亿美元

【AI模型】谷歌发布超小型开源AI模型Gemma 3 270M

*   拥有2.7亿参数的开源模型,适合在智能手机上离线运行

*   在指令跟随任务中表现出色,能效高

*   支持快速微调,适用于企业开发和创造性应用

详情链接: developers.googleblog.com