【AI日报】EP.199 8月18 腾讯推音效生成工具AudioGenie;阿里推智能体WebWatcherAishaobing的个人播客

【AI日报】EP.199 8月18 腾讯推音效生成工具AudioGenie;阿里推智能体WebWatcher

8分钟 ·
播放数107
·
评论数0

【AI工具】 🎵 腾讯推音效生成工具AudioGenie

*   支持视频、文本和图像等多模态输入,一键生成电影级音效。

*   采用无训练多智能体框架,实现高效协同与自我纠错。

*   在MA-Bench基准测试中表现优异,挑战Claude与Gemini。

详情链接: audiogenie.github.io

【AI智能体】 🤖 阿里推出多模态深度研究智能体WebWatcher

*   一个开源的多模态深度研究智能体,能处理复杂的多模态任务。

*   整合网页浏览、图像搜索、代码解释器和OCR等多种工具。

*   在多个评测中表现显著优于其他主流模型。

详情链接: github.com

【3D建模】 🏗️ 港大、哈工大、浙大联合推出可解耦3D模型技术OmniPart

*   实现3D模型部件的独立性和结构清晰性,重塑创意设计。

*   采用自回归模型与部件掩码的两阶段生成框架,提升建模精确度。

*   适用于游戏开发、动画制作等多个创意领域。

详情链接: omnipart.github.io

【AI模型】 🖼️ Meta 发布 DINOv3,无需标注数据的通用图像处理 AI 新模型

*   基于17亿张图像进行自监督学习训练,拥有70亿个参数。

*   性能优于上一代模型 DINOv2,无需标注数据。

*   已在GitHub上开放多个预训练模型变体及代码,允许商业使用。

详情链接: github.com

【行业大模型】 ⚖️ 我国首个法律垂直大模型“小包公”发布

*   正式发布,标志着法律人工智能进入规模化应用阶段。

*   整合了2亿份裁判文书和420余万部法律法规,提供能溯源、可验证的法律依据。

*   有望缓解法律服务资源分布不均问题。

【行业动态】 📈 ChatGPT移动端收入突破20亿美元

*   移动应用收入是竞争对手总和的30倍,显示出其在AI助手领域的主导地位。

*   月收入增长高达673%,远超其他聊天机器人。

*   全球下载量达6.9亿次,是Grok的17倍。

【移动AI】 📱 安卓手机集体抄作业灵动岛,新芯片推动AI功能爆发

*   各安卓厂商推出类似苹果灵动岛的交互设计,提升用户体验。

*   新一代芯片算力翻倍,为AI功能普及奠定基础。

*   厂商全量集成AI功能,提供一键订票、行程规划等智能服务。

【AI模型】 🧠 欧洲AI创企发布鸡脑和蝇脑模型,94MB超小AI可离线运行

*   Multiverse Computing推出SuperFly和ChickBrain两款超小型AI模型。

*   模型体积小巧,可在物联网设备、智能手机等终端本地运行。

*   性能表现优异,在一些基准测试中超越了原始模型。

【AI编程】 👨‍💻 Claude Code重大更新!新增编程导师模式

*   新增针对编程初学者的个性化沟通风格设置,包括解释型和学习型。

*   解释型风格专注于深度教学,帮助开发者理解代码背后的原理。

*   新的导师模式让初学者也能享受一对一代码指导,降低学习门槛。

【AI安全】 ⚠️ AI技术被滥用成“退款神器”,商家无奈

*   电商平台出现利用AI伪造商品损坏图片进行恶意退款的现象。

*   该行为可能构成民事欺诈或刑事诈骗。

*   法律专家呼吁加强监管和技术创新以应对这一问题。

【行业报告】 📊 IDC报告:2024年中国AI公有云服务市场激增,阿里云蝉联第一

*   2024年中国AI公有云服务市场规模预计达到195.9亿元,同比增长55.3%。

*   计算机视觉和对话式AI市场表现突出。

*   报告指出技术提供商需重构云服务架构,加强AI治理。