Anthropic联合创始人Tom Brown分享了他从早期创业到共同创立顶级AI实验室的职业历程。他深入探讨了AI扩展定律在模型发展中的关键作用,Anthropic如何通过以开发者为中心和注重安全性的策略来构建Claude,并强调了为满足AI持续发展需求而进行的空前规模的计算基础设施建设。
个人AI之路与创业经验
早期创业经历: Tom Brown在Linked Language和Grouper等早期创业公司积累经验,培养了自力更生和从失败中学习的“狼性”思维。
转型AI研究: 尽管大学线性代数成绩不佳,他通过自学(如Coursera课程和Kaggle项目)努力转型AI研究领域。
加入OpenAI: 通过Greg Brockman的引荐,他作为早期工程师加入OpenAI,主要负责分布式系统工作,并参与了GPT-3的工程建设。
AI扩展定律与Anthropic的诞生
发现扩展定律: 在OpenAI工作期间,他见证了“扩展定律”的重要性,即通过增加计算量可以可靠地提升AI模型智能,尽管初期这一方法被一些人视为“浪费”或“不优雅”。
Anthropic的创立动因: 出于对AI安全和潜在变革性影响的共同关注,他与OpenAI的同事们(包括Dario和Daniela Amodei)共同创立了Anthropic,该团队以使命为驱动。
早期挑战与文化: Anthropic创立初期面临资源不如OpenAI的挑战,但其以使命为核心的文化吸引了早期团队成员,确保了组织凝聚力。
Anthropic的产品开发与策略
Claude的演进与成功: Anthropic在ChatGPT发布后重新推出API,其模型Claude,特别是Claude 3.5 Sonnet,在编码能力上取得了显著突破,成为开发者首选。
开发者优先与API策略: Anthropic致力于成为一个开发者优先、API驱动的AI实验室,旨在提供最佳平台供其他创新者在其基础上构建应用。
“将模型视为用户”: 团队在开发中将Claude模型本身视为用户,为其设计工具和优化上下文,这一理念被认为是Claude Code成功的关键。
AI计算基础设施的挑战与未来
史上最大规模基础设施建设: AI计算基础设施的建设被描述为人类历史上最大规模的基础设施建设,其扩张速度(每年约3倍)令人震惊。
主要瓶颈: 电力供应是当前AI计算基础设施建设的最大瓶颈,尤其是在美国,呼吁简化数据中心建设许可。
多芯片策略: Anthropic是少数采用多种芯片(包括GPU、TPU和Tranium)的AI实验室,这使其能够更灵活地获取计算资源,并根据任务需求匹配最合适的硬件。

