英伟达 2025 年 GPU 技术大会(GTC):具身智能与物理人工智能的曙光

英伟达 2025 年 GPU 技术大会(GTC):具身智能与物理人工智能的曙光

11分钟 ·
播放数60
·
评论数0

#中文音频

来源: NVIDIA CEO Jensen Huang在CES 2025上的主题演讲节选

主要主题和重要思想/事实:

  1. AI的本质:智能的制造工厂和Token的生成器。
  • 黄仁勋将AI描述为一种“新工厂”,它生成“tokens”,即AI的构建模块。他表示:“this is how intelligence is made a new kind of factory generator of tokens the building blocks of AI”。
  • Tokens被认为是通往“非凡世界”的第一步,能够将文字转化为知识,为图像注入生命,将想法转化为视频,帮助安全导航环境,指导机器人运动,甚至在医疗和金融领域带来深刻影响。
  1. NVIDIA的AI之旅:从GPU到AI的革命。
  • 演讲回顾了NVIDIA自1993年成立以来的发展历程,特别是GPU的创新,以及CUDA平台的推出,如何为现代计算机图形学和后来的AI发展奠定了基础。
  • 他特别提到了2012年AlexNet对CUDA的使用以及2018年Google Transformer(BERT)的发布,这两者被认为是AI领域加速发展的关键节点。他表示:“Transformers as you know completely changed the land landcape for artificial intelligence in fact it completely changed the landscape for computing altogether”。
  • 黄仁勋认为AI,尤其是由Transformer推动的机器学习,正在从根本上改变计算的工作方式,涉及技术堆栈的每一个层面。
  1. RTX Blackwell家族:AI赋能下一代图形处理。
  • 演讲重点发布了NVIDIA下一代RTX Blackwell GPU家族,包括RTX 5070到5090。
  • 强调了AI在Blackwell架构中的核心作用,特别是DLSS(深度学习超采样)技术的进步,它能够通过AI生成大量像素,显著提升性能和效率。“it is an absolute miracle that we can computationally comput tionally using programmable shaders and our R traced engine R tracing engine to compute 2 million pixels and have ai predict all of the other 33”。
  • RTX Blackwell家族具有更高的晶体管数量、TOPS(每秒万亿次操作)和Tensor Cores性能,以及更高的内存带宽和新的神经纹理压缩、神经材质着色技术,这些都得益于AI的应用。
  • RTX 5070的性能达到上一代RTX 4090的水平,而价格仅为549美元,这被归功于AI的赋能。
  1. AI的“缩放定律”及其对计算需求的推动。
  • 黄仁勋强调了AI的“缩放定律”:更多的数据、更大的模型和更多的计算投入会带来更强大、更有效的模型。
  • 除了传统的预训练缩放定律,他还介绍了“后训练缩放定律”(Post-training scaling law),通过强化学习和人类反馈等技术进一步优化模型;以及“测试时缩放定律”(Test time scaling),通过推理时的资源分配(如推理和长思考)提高答案质量。
  • 这些缩放定律正在推动对NVIDIA计算能力的巨大需求,促使Blackwell等高性能芯片的生产和部署。
  1. Blackwell系统的生产和部署:大规模AI工厂。
  • Blackwell芯片已全面投产,并在全球45家工厂生产,有200多种不同配置,支持气冷、液冷、x86和NVIDIA Grace CPU等多种系统。
  • 展示了Blackwell系统的强大能力,例如GB200 MVLink 72系统,重达1.5吨,包含大量零部件和电缆,性能/瓦特比上一代提高四倍,性能/美元提高三倍。
  • 这些系统被描述为“AI工厂”,正在生成AI tokens,为各种AI应用提供动力,并有助于克服数据中心的功率限制。
  • 展示了一个包含72个Blackwell GPU的系统,具有1.4 exaflops的AI浮点性能,14TB内存和1.2 petabytes/秒的内存带宽,被誉为“世界上最大的单芯片”,彰显了大规模计算的成就。
  1. Agentic AI的兴起:系统化的AI工作者。
  • 黄仁勋认为Agentic AI是Test time scaling的完美例子,是一种由多个模型组成的系统,能够感知、推理、规划和行动。
  • Agentic AI agents被视为未来的“数字劳动力”,能够与人类员工协作,执行各种任务。
  • NVIDIA提供Agentic AI的构建模块,包括NVIDIA Nims(AI微服务)、NVIDIA Nemo(数字员工入职、培训和评估系统)以及各种开源蓝图。
  • 这些工具旨在帮助IT部门构建、管理和部署领域特定的AI agents,IT部门将成为AI agents的“HR部门”。
  1. NVIDIA Llama Neotron语言基础模型:针对企业优化。
  • 宣布推出基于Llama 3.1的NVIDIA Llama Neotron语言基础模型系列,旨在为企业用户提供更好的微调模型。
  • 这些模型在各种AI agent功能相关的排行榜上表现出色,包括聊天、指令遵循和检索。
  • NVIDIA与ServiceNow、SAP、西门子、Cadence、Synopsys等合作伙伴合作,将这些AI技术集成到各种企业应用中。
  • 他预测软件编码将成为下一个大型AI应用领域,AI助手将极大地提高全球3000万软件工程师的生产力。
  1. 物理AI和NVIDIA Cosmos:理解和模拟物理世界的基础模型。
  • 黄仁勋介绍了物理AI,即能够理解物理世界的AI,并宣布推出NVIDIA Cosmos,被认为是“世界第一个世界基础模型”。
  • Cosmos旨在理解物理世界的“语言”,包括物理动力学(重力、摩擦、惯性)、几何和空间关系、因果关系和物体永久性。
  • Cosmos平台包括自回归和扩散式世界基础模型、高级分词器和加速的数据流水线,用于开发和推进物理AI。
  • Cosmos与NVIDIA Omniverse(物理模拟平台)相结合,提供“接地”(grounding)能力,生成物理上准确和逼真的合成数据。他表示:“When you connect that to Cosmos it provides the grounding the ground truth that can control and to condition the Osmos generation as a result what comes out of Osmos is grounded on Truth”。
  1. 三台计算机:机器人系统的基础架构。
  • 黄仁勋提出了构建机器人系统需要“三台计算机”的理念:
  • DGX计算机: 用于训练AI模型。
  • AGX计算机: 部署在汽车、机器人或工业设备中,用于推理和自主行动。
  • 数字孪生(Omniverse): 用于模拟、测试、验证和生成合成数据。
  • 这三台计算机将交互工作,构成NVIDIA在工业领域的战略核心。
  1. 物理AI的应用:工业数字化、自动驾驶汽车和人形机器人。
  • 工业数字化: 与Keon和Accenture合作,利用Omniverse构建仓库数字孪生,通过模拟优化机器人车队性能。“in the future every Factory will have a digital twin and that digital twin operates exactly like the real factory”。
  • 自动驾驶汽车(AV): 强调AV革命已经到来,并宣布丰田将与NVIDIA合作开发下一代AV。展示了利用Omniverse、AI模型和Cosmos构建AV数据工厂,将数千次驾驶转化为数十亿英里有效训练数据的能力。推出下一代汽车处理器Thor,性能是上一代Orin的20倍,并宣布Drive OS已获得汽车功能安全最高标准ASIL D认证。“building safe autonomous vehicles means addressing Edge scenarios but real world data is limited so synthetic data is essential for training”。
  • 人形机器人: 预测通用机器人的ChatGPT时刻即将到来,并推出了NVIDIA Isaac Groot平台,为人形机器人开发者提供机器人基础模型、数据流水线、模拟框架和Thor机器人计算机。Isaac Groot通过遥操作和合成运动生成技术,从少量人类演示中生成海量训练数据,加速通用机器人的发展。“human robots my friends the chat GPT moment for General robotics is just around the corner”。
  1. Project Digits/DGX Cloud:为每个人提供AI超级计算。
  • 回顾了DGX-1在AI研究和OpenAI等初创公司中的革命性作用。
  • 宣布推出新的、更小的AI超级计算机,代号Project Digits,基于Grace Blackwell GB200芯片(最小的Grace Blackwell),旨在将AI超级计算带给每一位工程师、开发者和创意艺术家。
  • 这款小型DGX系统可以作为云平台或Linux工作站,预计在五月上市。
  1. Windows PC作为AI PC平台:利用WSL2。
  • NVIDIA致力于将Windows PC转变为世界一流的AI PC平台,利用Windows WSL2(适用于Linux的Windows子系统)。
  • WSL2支持CUDA,并针对云原生应用和Bare Metal访问进行了优化,使得NVIDIA的AI堆栈(Nims、Nemo、蓝图)能够直接在Windows PC上运行。“our focus is to turn Windows wsl2 Windows PC into a Target first class platform that we will support and maintain for as long as we shall live”。
  • 展示了一个使用NVIDIA Nim微服务和3D对象指导AI图像生成的示例,强调了AI赋能PC端的创作。

结论:

Jensen Huang的演讲描绘了AI驱动的计算和机器人时代的未来愿景。NVIDIA通过Blackwell GPU、Thor处理器以及Cosmos、Omniverse、Nims、Nemo、Isaac Groot等平台和工具,正在构建这一未来所需的基础设施和技术。Agentic AI和物理AI被认为是下一波创新浪潮的关键,并将深刻改变各行各业的工作方式。NVIDIA的策略是通过与开发者和生态系统伙伴合作,将AI技术普及到云、企业和个人电脑中,并推动机器人技术实现大规模部署。演讲充满了对AI潜力的热情和对NVIDIA技术能力的信心。