Grok3: 马斯克的新AI模型，暴力美学与慢思考的结合

通往超级个体之路 | Episode 19 | Grok3: 马斯克的新AI模型，暴力美学与慢思考的结合

PadNotes

00:00 开场

大家好，欢迎来到《通往超级个体之路》第 19 期！今天我将和大家分享一个全新的 AI 模型，叫做 Grok3。这个模型由马斯克团队研发，目前是人类评分最高的 AI 模型，超越了 OpenAI 的 O1 PRO，以及我们国内最强的 DeepSeek r1。

我在了解了 Grok3 的一些真相之后，发现它的确是一个暴力美学的产物，与国内的精致小而精的模型（如 DeepSeek）不同，Grok3 使用了巨大的算力进行训练。

00:33 Grok3: 暴力美学的体现

00:58 Grok3 的训练规模

• Grok3 的训练使用了20万张 H100 GPU，这意味着巨大的计算资源！

• 相比之下，DeepSeek 仅使用了几千张阉割版 H800 GPU，就训练出了强大的模型。

• Grok3 的计算资源优势来自 马斯克的理念，即通过规模效应，在大量算力的支持下实现突破。

• 这种“暴力出奇迹”的方式，符合马斯克团队的一贯思路：大力扩展规模，借助强大的算力产生奇迹。

01:20 体验 Grok3：流畅与智能的结合

01:30 深入体验

• 我在今天早晨第一次体验了 Grok3，给我的感觉非常好。

• 特别是在网络访问方面，Grok3 运行非常流畅且丝滑，无论是使用 DeepSeek 功能 还是正常提问，都能轻松完成。

• 它能够高效检索并整理各种网上的信息，将问题分解成多个步骤，逐步完成思考。

02:21 Grok3 vs. OpenAI DeepSeek: 幻觉的挑战

02:33 幻觉问题

• 尽管 Grok3 的 DeepSeek 功能很强大，但相比于 OpenAI 的同类功能，Grok3 仍然存在一些幻觉问题。

• 比如，你提问后，Grok3 会给出一堆链接，但点击链接后发现许多网站无法访问或内容与问题不相关。

• 这表明Grok3 作为 Beta 版本仍需进一步完善，特别是在减少幻觉方面。

03:24 华人在 Grok3 和 DeepSeek 的核心作用

03:43 华人科学家的贡献

• Grok3 与 DeepSeek 都展示了华人在 AI 领域的重要作用，尤其在模型开发中起到了至关重要的作用。

• 在 DeepSeek 的核心开发者中，有 11 位是中国人或华裔，而 Grok3 也不例外。

• Grok3 的两个核心开发者分别来自浙江大学和杭州建兰中学。这个国际化的团队，结合了中美两国的技术优势，推动了 AI 领域的进步。

04:35 Grok3 的产业影响与未来展望

05:00 Grok3 与 OpenAI 模型的对比

• Grok3 的性能与 OpenAI O1 PRO 之间差异不大，虽然差距存在，但并不显著。

• 在发布会上，马斯克团队强调了 Grok3 背后强大的工厂支撑，这使得这种模型能够实现大规模的批量化生产。

05:15 从工厂到算力集群：马斯克的“大规模计划”

05:38 孟菲斯工厂的重生

• Grok3 的算力集群位于 孟菲斯工厂，这个工厂之前是生产烤箱的，但在 2020 年倒闭后，被马斯克收购并改造成了全球最大规模的算力中心。

• 通过短短的 120 天时间，马斯克团队搭建了 10 万张 H100 的算力集群，并在 90 天内又完成了第二个 10 万张集群的搭建。

06:00 电力与冷却技术

• 为了确保电力稳定，马斯克还使用了 特斯拉的技术，包括电力存储设备，保证工厂在任何情况下都能维持算力运行。

06:37 Scaling & Collaboration: 让 AI 协作完成复杂任务

• 随着算力的规模扩大，集群内的机器不仅仅是单独运作，它们需要协同工作，共同完成计算任务。

• 这一过程涉及到复杂的数据层面问题和高效的调度问题。

• 根据一个数据，假如算力调度达到 1000 张 GPU，效率下降至不到 90%。随着集群规模的增大，调度效率逐步下降，成为计算中心的一大挑战。

07:48 未来模型的发展方向

08:37 开源策略：马斯克的“隔代开源”

• 马斯克的开源策略：他提出，一旦 Grok3 发布后，Grok2 会立即开源。

• 这一策略对 AI 行业意义重大，因为它为开发者和科研人员提供了宝贵的实验资源，而不需要从零开始。

09:07 高昂的成本：60 亿美元的算力投资

• 马斯克投资了60 亿美金购买 20 万张 GPU（不包括厂房和设备的购买）。

• 每年的运维成本也非常高，达到十亿美金。这种大规模的投资不仅推动了 Grok3 的发展，也带动了 AI 算力产业的进步。

10:26 人工智能与人类的关系：自我调节的未来

10:44 人类微调的未来

• 过去 AI 模型需要人类微调，但未来 AI 可能不再依赖于人类的监督，它将能自主调节并且优化自己的能力。

• AI 自我成长的能力将打破传统的训练方式，使模型更加强大。

11:16 产业影响：算力依赖与产业变革

• 算力对产业的影响：Grok3 的发布对算力企业（如英伟达）带来巨利，未来 算力的生产和调度 将成为最重要的产业竞争力之一。

• AI 模型对中小企业的挑战：开源模型的发展将使得一些中小 AI 企业面临更大的竞争压力，尤其是需要依赖传统封闭模型的公司。

12:16 创业机会的变化

• 随着 AI 技术的发展，创业机会会进一步下沉到算力提供商层面，像 阿里、腾讯 这样的企业可能成为算力的主要提供者。

• 中小企业将面临选择：要么将应用交给大厂，要么像幻方那样进行深度研发。

13:52 未来的AI产业格局：开源与创新并行

14:13 产业方向

• 对于广泛的产业方来说，Grok3 的发布将带来一场AI 技术普及的革命，更多的优秀模型和更低的成本将使各行各业的应用更加普及。

15:18 总结：Grok3 的意义与挑战

• Grok3 的发布标志着 AI 技术的规模化突破，但它也带来了大量的挑战，包括幻觉问题和 信息污染 的潜在风险。

• 尽管如此，Grok3 和其他 AI 大模型的发布对全球 AI 行业的发展具有重要意义，推动了算力依赖和跨行业协作的深入。

欢迎留言讨论：

• 你如何看待 Grok3 在 AI 领域的表现？

• 开源策略 是否能为整个行业带来更多机会？

• AI 自我调节 会是未来发展的趋势吗？

感谢大家收听，我们下期见！🚀