AIGC Weekly #136歸藏的个人播客

AIGC Weekly #136

26分钟 ·
播放数167
·
评论数0

大家好,我是歸藏欢迎收听 AIGC 周刊的 136 期(8 月 18 日到 8 月 24 日)的内容。

AI游戏与沉浸式内容创新

  • Runway Game Worlds: 正式上线,用户可创建或游玩非线性叙事AI游戏,通过实时生成的图文内容和数据驱动目标感,提升互动体验。
  • Aivilization(香港科技大学): 开放式数字沙盒游戏,Agent角色可进行采集、交易、学习,模拟复杂的AI社会行为并实现多用户联机交互。
  • World Labs(李飞飞): 推出3D空间生成平台,允许用户通过单张图片生成可探索的3D环境,融合计算机视觉重建与生成式填充技术。
  • Mirage 2: 实时AI生成游戏引擎,玩家能用自然语言或图片即时生成并修改游戏世界,实现动态、互动且持续的用户生成内容(UGC)玩法。

核心AI模型与硬件集成进展

  • Deepseek V3.1模型: 发布新版模型,整合推理与非推理模式,显著增强Agent能力,并在思考模式下能耗(token消耗)减少20%-50%。
  • 谷歌Pixel硬件发布会: 全系Pixel 10手机搭载Google Tensor G5芯片,实现Gemini Nano本地运行,使所有系统应用全面AI化。
  • Pixel AI功能: 涵盖Magic Cue信息串联、Voice Translate实时翻译、Call Screen留言转录、Gemini Live视频生成等,深度集成于手机生态。
  • 其他模型更新: 阿里巴巴开源Qwen-Image-Edit图像编辑模型,XAI开源Grok 2.5模型并预告Grok 3。

AI工具与Agent应用拓展

  • Agent Opus: 定位为“内部创意团队”的AI视频Agent,专为社交媒体设计,能根据用户品味生成专业营销视频。
  • Wonder: AI原生设计工具,提供无限画布和智能设计理解,通过AI实时建议帮助设计师高效创作和构建设计系统。
  • Gizmo: 移动端Vibe Coding工具,用户仅通过手机相机和触控即可创作个性化、互动性强的微型软件(Gizmos)。
  • AI Agent军团: 用户在n8n平台构建由8个AI Agent组成的多Agent系统,通过Telegram实现语音和文本控制,替代个人助理工作。

AI技术前沿研究与效率优化

  • Avengers-Pro: 提出测试时路由框架,通过集成不同容量的LLM,实现性能-效率权衡,在成本降低27%-63%的情况下,性能超越或接近最强单一模型。
  • ComputerRL: 用于自主桌面智能的框架,采用API-GUI范式,通过分布式强化学习实现Agent在复杂数字工作空间的熟练操作。
  • 谷歌AI能耗研究: 谷歌云发布AI推理(如Gemini模型)对环境影响的测算方法,强调其能耗远低于公开估算,并致力于持续优化。
  • 并行文本生成综述: 深入分析旨在打破自回归生成瓶颈、提高推理效率的各类技术,探索未来文本生成的速度与质量提升方向。