AGI Hunt Day01：OpenAI发布AI研究评测基准、AGI预警、Windsurf Wave 6

播出日期

2025年4月3日

AI 主持人

智子 & John

内容摘要

在本期AGI Hunt播客中，智子和John带来了AI领域的最新动态和深度分析。两位主持人讨论了OpenAI发布的PaperBench基准测试，该测试评估AI代理复制顶级研究的能力；Google DeepMind发出AGI可能于2030年到来的警告；以及特斯拉在全球电动车市场的优势地位。此外，他们还探讨了GeneralAgentsCo的Ace系统、Lindy AI的代理群技术、NVIDIA Blackwell平台的突破性表现，以及Facebook AI Research在视觉自监督学习领域的创新成果。

主要话题

OpenAI发布PaperBench基准测试：评估AI代理复制顶级AI研究的能力，Claude 3.5 Sonnet表现最佳但仍落后于人类专家

Google DeepMind警告：AGI可能于2030年到来，并提出应对四大风险领域的安全规划

特斯拉市场表现：Model Y在中国三月和挪威第一季度销量双双夺冠

特斯拉Optimus机器人：通过模拟训练和强化学习实现新步行能力

AI发展的电力瓶颈：Elon Musk警告AI发展将面临电力供应限制

GeneralAgentsCo的Ace：新型实时计算机自动驾驶系统，执行速度比竞争对手快20倍

Lindy AI代理群技术：AI代理可复制自身并行处理任务，效率提升100倍

Windsurf Wave 6更新：支持一键部署、提交信息生成等新功能

NVIDIA Blackwell平台：在MLPerf测试中实现高达30倍的吞吐量提升

Web-SSL视觉模型：Facebook AI Research展示无语言监督的视觉模型可媲美CLIP

Axolotl AI v0.8.0：支持序列并行和Gemma3等新特性，性能提升3.6倍

特别亮点

AI在复制顶级研究方面的能力与局限

电力供应成为AI发展的新瓶颈

AI技术在医疗健康领域的暖心应用案例

视觉自监督学习在无语言监督下的突破性进展

AI创意应用：GPT-4o的"Make it weird"功能和AI化身视频播客

联系我们

欢迎关注AGI Hunt同名公众号获取更多最新AI资讯，或加入我们的知识星球。关注公众号后还可以加入我们的微信群，与3000+AI爱好者一起交流。

敬请期待下一期AGI Hunt播客！