通往超级个体之路 | Episode 19 | Grok3: 马斯克的新AI模型,暴力美学与慢思考的结合
PadNotes
00:00 开场
大家好,欢迎来到《通往超级个体之路》第 19 期!今天我将和大家分享一个全新的 AI 模型,叫做 Grok3。这个模型由马斯克团队研发,目前是人类评分最高的 AI 模型,超越了 OpenAI 的 O1 PRO,以及我们国内最强的 DeepSeek r1。

我在了解了 Grok3 的一些真相之后,发现它的确是一个暴力美学的产物,与国内的精致小而精的模型(如 DeepSeek)不同,Grok3 使用了巨大的算力进行训练。
00:33 Grok3: 暴力美学的体现
00:58 Grok3 的训练规模
• Grok3 的训练使用了20万张 H100 GPU,这意味着巨大的计算资源!
• 相比之下,DeepSeek 仅使用了几千张阉割版 H800 GPU,就训练出了强大的模型。
• Grok3 的计算资源优势来自 马斯克的理念,即通过规模效应,在大量算力的支持下实现突破。
• 这种“暴力出奇迹”的方式,符合马斯克团队的一贯思路:大力扩展规模,借助强大的算力产生奇迹。
01:20 体验 Grok3:流畅与智能的结合
01:30 深入体验
• 我在今天早晨第一次体验了 Grok3,给我的感觉非常好。
• 特别是在网络访问方面,Grok3 运行非常流畅且丝滑,无论是使用 DeepSeek 功能 还是正常提问,都能轻松完成。
• 它能够高效检索并整理各种网上的信息,将问题分解成多个步骤,逐步完成思考。
02:21 Grok3 vs. OpenAI DeepSeek: 幻觉的挑战
02:33 幻觉问题
• 尽管 Grok3 的 DeepSeek 功能很强大,但相比于 OpenAI 的同类功能,Grok3 仍然存在一些幻觉问题。
• 比如,你提问后,Grok3 会给出一堆链接,但点击链接后发现许多网站无法访问或内容与问题不相关。
• 这表明Grok3 作为 Beta 版本仍需进一步完善,特别是在减少幻觉方面。
03:24 华人在 Grok3 和 DeepSeek 的核心作用
03:43 华人科学家的贡献
• Grok3 与 DeepSeek 都展示了华人在 AI 领域的重要作用,尤其在模型开发中起到了至关重要的作用。
• 在 DeepSeek 的核心开发者中,有 11 位是中国人或华裔,而 Grok3 也不例外。
• Grok3 的两个核心开发者分别来自浙江大学和杭州建兰中学。这个国际化的团队,结合了中美两国的技术优势,推动了 AI 领域的进步。
04:35 Grok3 的产业影响与未来展望
05:00 Grok3 与 OpenAI 模型的对比
• Grok3 的性能与 OpenAI O1 PRO 之间差异不大,虽然差距存在,但并不显著。
• 在发布会上,马斯克团队强调了 Grok3 背后强大的工厂支撑,这使得这种模型能够实现大规模的批量化生产。
05:15 从工厂到算力集群:马斯克的“大规模计划”

05:38 孟菲斯工厂的重生
• Grok3 的算力集群位于 孟菲斯工厂,这个工厂之前是生产烤箱的,但在 2020 年倒闭后,被马斯克收购并改造成了全球最大规模的算力中心。
• 通过短短的 120 天时间,马斯克团队搭建了 10 万张 H100 的算力集群,并在 90 天内又完成了第二个 10 万张集群的搭建。
06:00 电力与冷却技术
• 为了确保电力稳定,马斯克还使用了 特斯拉的技术,包括电力存储设备,保证工厂在任何情况下都能维持算力运行。
06:37 Scaling & Collaboration: 让 AI 协作完成复杂任务
• 随着算力的规模扩大,集群内的机器不仅仅是单独运作,它们需要协同工作,共同完成计算任务。
• 这一过程涉及到复杂的数据层面问题和高效的调度问题。
• 根据一个数据,假如算力调度达到 1000 张 GPU,效率下降至不到 90%。随着集群规模的增大,调度效率逐步下降,成为计算中心的一大挑战。
07:48 未来模型的发展方向
08:37 开源策略:马斯克的“隔代开源”
• 马斯克的开源策略:他提出,一旦 Grok3 发布后,Grok2 会立即开源。
• 这一策略对 AI 行业意义重大,因为它为开发者和科研人员提供了宝贵的实验资源,而不需要从零开始。
09:07 高昂的成本:60 亿美元的算力投资
• 马斯克投资了60 亿美金购买 20 万张 GPU(不包括厂房和设备的购买)。
• 每年的运维成本也非常高,达到十亿美金。这种大规模的投资不仅推动了 Grok3 的发展,也带动了 AI 算力产业的进步。
10:26 人工智能与人类的关系:自我调节的未来
10:44 人类微调的未来
• 过去 AI 模型需要人类微调,但未来 AI 可能不再依赖于人类的监督,它将能自主调节并且优化自己的能力。
• AI 自我成长的能力将打破传统的训练方式,使模型更加强大。
11:16 产业影响:算力依赖与产业变革
• 算力对产业的影响:Grok3 的发布对算力企业(如英伟达)带来巨利,未来 算力的生产和调度 将成为最重要的产业竞争力之一。
• AI 模型对中小企业的挑战:开源模型的发展将使得一些中小 AI 企业面临更大的竞争压力,尤其是需要依赖传统封闭模型的公司。
12:16 创业机会的变化
• 随着 AI 技术的发展,创业机会会进一步下沉到算力提供商层面,像 阿里、腾讯 这样的企业可能成为算力的主要提供者。
• 中小企业将面临选择:要么将应用交给大厂,要么像 幻方 那样进行深度研发。
13:52 未来的AI产业格局:开源与创新并行
14:13 产业方向
• 对于广泛的产业方来说,Grok3 的发布将带来一场AI 技术普及的革命,更多的优秀模型和更低的成本将使各行各业的应用更加普及。
15:18 总结:Grok3 的意义与挑战
• Grok3 的发布标志着 AI 技术的规模化突破,但它也带来了大量的挑战,包括 幻觉 问题和 信息污染 的潜在风险。
• 尽管如此,Grok3 和其他 AI 大模型的发布对全球 AI 行业的发展具有重要意义,推动了算力依赖和跨行业协作的深入。
欢迎留言讨论:
• 你如何看待 Grok3 在 AI 领域的表现?
• 开源策略 是否能为整个行业带来更多机会?
• AI 自我调节 会是未来发展的趋势吗?
感谢大家收听,我们下期见!🚀