Grok3: 马斯克的新AI模型,暴力美学与慢思考的结合通往超级个体之路

Grok3: 马斯克的新AI模型,暴力美学与慢思考的结合

22分钟 ·
播放数1420
·
评论数7

通往超级个体之路 | Episode 19 | Grok3: 马斯克的新AI模型,暴力美学与慢思考的结合

PadNotes

00:00 开场

大家好,欢迎来到《通往超级个体之路》第 19 期!今天我将和大家分享一个全新的 AI 模型,叫做 Grok3。这个模型由马斯克团队研发,目前是人类评分最高的 AI 模型,超越了 OpenAI 的 O1 PRO,以及我们国内最强的 DeepSeek r1

我在了解了 Grok3 的一些真相之后,发现它的确是一个暴力美学的产物,与国内的精致小而精的模型(如 DeepSeek)不同,Grok3 使用了巨大的算力进行训练。

00:33 Grok3: 暴力美学的体现

00:58 Grok3 的训练规模

Grok3 的训练使用了20万张 H100 GPU,这意味着巨大的计算资源!

• 相比之下,DeepSeek 仅使用了几千张阉割版 H800 GPU,就训练出了强大的模型。

• Grok3 的计算资源优势来自 马斯克的理念,即通过规模效应,在大量算力的支持下实现突破。

• 这种“暴力出奇迹”的方式,符合马斯克团队的一贯思路:大力扩展规模,借助强大的算力产生奇迹

01:20 体验 Grok3:流畅与智能的结合

01:30 深入体验

• 我在今天早晨第一次体验了 Grok3,给我的感觉非常好。

• 特别是在网络访问方面,Grok3 运行非常流畅且丝滑,无论是使用 DeepSeek 功能 还是正常提问,都能轻松完成。

• 它能够高效检索并整理各种网上的信息,将问题分解成多个步骤,逐步完成思考。

02:21 Grok3 vs. OpenAI DeepSeek: 幻觉的挑战

02:33 幻觉问题

• 尽管 Grok3 的 DeepSeek 功能很强大,但相比于 OpenAI 的同类功能,Grok3 仍然存在一些幻觉问题。

• 比如,你提问后,Grok3 会给出一堆链接,但点击链接后发现许多网站无法访问或内容与问题不相关。

• 这表明Grok3 作为 Beta 版本仍需进一步完善,特别是在减少幻觉方面。

03:24 华人在 Grok3 和 DeepSeek 的核心作用

03:43 华人科学家的贡献

Grok3DeepSeek 都展示了华人在 AI 领域的重要作用,尤其在模型开发中起到了至关重要的作用。

• 在 DeepSeek 的核心开发者中,有 11 位是中国人或华裔,而 Grok3 也不例外。

Grok3 的两个核心开发者分别来自浙江大学和杭州建兰中学。这个国际化的团队,结合了中美两国的技术优势,推动了 AI 领域的进步。

04:35 Grok3 的产业影响与未来展望

05:00 Grok3 与 OpenAI 模型的对比

Grok3 的性能与 OpenAI O1 PRO 之间差异不大,虽然差距存在,但并不显著。

• 在发布会上,马斯克团队强调了 Grok3 背后强大的工厂支撑,这使得这种模型能够实现大规模的批量化生产。

05:15 从工厂到算力集群:马斯克的“大规模计划”

05:38 孟菲斯工厂的重生

• Grok3 的算力集群位于 孟菲斯工厂,这个工厂之前是生产烤箱的,但在 2020 年倒闭后,被马斯克收购并改造成了全球最大规模的算力中心

• 通过短短的 120 天时间,马斯克团队搭建了 10 万张 H100 的算力集群,并在 90 天内又完成了第二个 10 万张集群的搭建。

06:00 电力与冷却技术

• 为了确保电力稳定,马斯克还使用了 特斯拉的技术,包括电力存储设备,保证工厂在任何情况下都能维持算力运行。

06:37 Scaling & Collaboration: 让 AI 协作完成复杂任务

• 随着算力的规模扩大,集群内的机器不仅仅是单独运作,它们需要协同工作,共同完成计算任务。

• 这一过程涉及到复杂的数据层面问题高效的调度问题

• 根据一个数据,假如算力调度达到 1000 张 GPU,效率下降至不到 90%。随着集群规模的增大,调度效率逐步下降,成为计算中心的一大挑战。

07:48 未来模型的发展方向

08:37 开源策略:马斯克的“隔代开源”

马斯克的开源策略:他提出,一旦 Grok3 发布后,Grok2 会立即开源。

• 这一策略对 AI 行业意义重大,因为它为开发者和科研人员提供了宝贵的实验资源,而不需要从零开始。

09:07 高昂的成本:60 亿美元的算力投资

• 马斯克投资了60 亿美金购买 20 万张 GPU(不包括厂房和设备的购买)。

• 每年的运维成本也非常高,达到十亿美金。这种大规模的投资不仅推动了 Grok3 的发展,也带动了 AI 算力产业的进步。

10:26 人工智能与人类的关系:自我调节的未来

10:44 人类微调的未来

• 过去 AI 模型需要人类微调,但未来 AI 可能不再依赖于人类的监督,它将能自主调节并且优化自己的能力。

AI 自我成长的能力将打破传统的训练方式,使模型更加强大。

11:16 产业影响:算力依赖与产业变革

算力对产业的影响Grok3 的发布对算力企业(如英伟达)带来巨利,未来 算力的生产和调度 将成为最重要的产业竞争力之一。

AI 模型对中小企业的挑战:开源模型的发展将使得一些中小 AI 企业面临更大的竞争压力,尤其是需要依赖传统封闭模型的公司。

12:16 创业机会的变化

• 随着 AI 技术的发展,创业机会会进一步下沉到算力提供商层面,像 阿里、腾讯 这样的企业可能成为算力的主要提供者

• 中小企业将面临选择:要么将应用交给大厂,要么像 幻方 那样进行深度研发。

13:52 未来的AI产业格局:开源与创新并行

14:13 产业方向

• 对于广泛的产业方来说,Grok3 的发布将带来一场AI 技术普及的革命,更多的优秀模型和更低的成本将使各行各业的应用更加普及。

15:18 总结:Grok3 的意义与挑战

Grok3 的发布标志着 AI 技术的规模化突破,但它也带来了大量的挑战,包括 幻觉 问题和 信息污染 的潜在风险。

• 尽管如此,Grok3 和其他 AI 大模型的发布对全球 AI 行业的发展具有重要意义,推动了算力依赖和跨行业协作的深入。

欢迎留言讨论:

• 你如何看待 Grok3 在 AI 领域的表现?

开源策略 是否能为整个行业带来更多机会?

AI 自我调节 会是未来发展的趋势吗?

感谢大家收听,我们下期见!🚀

展开Show Notes
Pog1
Pog1
2025.2.23
好悲哀,ai时代带来越来越多的信息,有效的、真实的部分却越来越少,对人们辨别misinformation的能力要求越来越高。我也注意到很多AI都是根据答案写过程,跟着提问的导向编造论据。但是很多人神化AI,将AI的回答作为自己的背书……
好久没更新了…
通往超级个体之路
:
我要回来啦,哈哈
沐风_SZdy
沐风_SZdy
2025.2.27
AI给信息茧房加了把锁
HD10270029
HD10270029
2025.2.21
确实好用,速度也快,而且不限制地区。
海风幽蓝
海风幽蓝
2025.2.19
Fsd什么时候宣布开源?开源不过是一种策略,走着看吧。
通往超级个体之路
:
特斯拉2023年6月开源过部分FSD专利,当时对国内自动驾驶技术提升很有帮助。最新的FSD可能会先商用再部分开源,毕竟核心科技,任何企业都会谨慎开源。