vol.165 - 2025年11月13日 李飞飞的 World Labs 正式发布Marble 3D世界模型并开启公测
6分钟
·
27
·
0
- AI领域持续升温,新模型和新应用层出不穷,令人瞩目。
- 本次讨论将聚焦原生全模态大模型、情感式对话、3D世界生成等前沿突破。
- 内容涵盖大厂动向、前沿研究、行业应用及开源社区的最新进展。
- 百度文心大模型5.0:号称全球首个“原生全模态”大模型,能从底层同时理解文本、图像和声音,告别了“拼接感”。
- Google Gemini Live:语音功能重磅更新,升级为“情感式对话伙伴”,能自然运用语调和节奏,并根据指令调整风格,极大提升了交互体验。
- 李飞飞团队World Labs推出Marble 3D世界模型。
- 仅需输入文本、图片或视频,10分钟即可生成可交互、可编辑的3D虚拟世界。
- 该技术突破了2D内容的局限,为游戏、模拟、教育等领域带来了无限的应用场景。
- 推荐系统安全:研究揭示了“个人资料污染攻击”,并提出CREAT框架以应对。
- 医疗AI:“Surgical AI Copilot”智能体能为手术提供实时决策支持,成为医生的“超级助手”。
- 灾难救援:“HitoMi-Cam”技术通过分析衣物光谱识别受害者,无需标准姿势,并可在边缘设备上运行,是救援现场的“神助攻”。
- ElevenLabs与巨星合作,推出官方授权的名人声音合成服务,标志着好莱坞对AI态度从警惕转向探索。
- 谷歌在德国投资64亿美元建设全新AI数据中心,并包含热能回收计划,实现了技术与环保的双赢。
- 大厂纷纷布局算力基础设施,预示着AI算力之争将愈发激烈。
- tech-interview-handbook:狂揽13万星标,被誉为编程面试终极宝典,成为开发者的重要资源。
- Wan2GP项目:为“显卡贫民”打造,通过优化让主流视频生成模型在6GB显存笔记本上流畅运行,实现了AI应用的普惠。
- GPT-5.1发布与Gemini 3“偷跑”测试引发关注,但模型的幻觉问题也提醒用户需谨慎使用。
- 李继刚老师提出人机协作的“透明盒”模式:人设定战略框架,AI执行战术,根据场景灵活调整介入程度,以发挥最大潜力。
- 总结:AI正以更人性化和普惠化的方式融入生活,其价值体现在解决医疗、救援等真实世界问题上,预示着一个智能、便捷且充满挑战的未来。