黄仁勋:转折点已然来临

admin92025-03-21 14:38:08

出品 | 虎嗅科技组

作者 | 余杨

编辑 | 苗正卿

头图 | 视觉中国

北京时间3月19日凌晨,NVIDIA首席执行官黄仁勋在GPU技术大会(GTC)上发表了主题演讲。数千名AI先锋、开发者和战略领导者在线聚集,共同探讨AI与加速计算等领域的最新突破,以及机器人、代理式AI、物理AI等热门话题的专题讨论。

演讲全球同步直播,黄仁勋身着标志性皮衣亮相,向观众展示了GeForce RTX 5090,回顾了英伟达的发展历程,并介绍了英伟达在人工智能领域的最新突破和未来发展方向。

黄仁勋指出,AI正从生成式迈向代理式(Agentic AI)和物理(Physical AI)时代,强调AI是终极生产力工具。英伟达凭借全栈技术(芯片、网络、软件)构建强大生态壁垒,将数据中心变为“Token工厂”,通过液冷机柜和硅光子技术提升算力与能效,重塑计算本质,推动AI从数字世界向物理世界渗透,开启智能新时代。

演讲要点如下:

1. AI技术的演进与核心突破

  • 生成式AI与推理模型:AI从感知(计算机视觉、语音识别)发展为生成式AI,能够跨模态转换(文本到图像、视频、蛋白质结构等),并通过“推理模型”逐步分解问题,生成更智能的响应。其核心是通过链式推理(Chain of Thought)生成大量令牌(tokens),提升结果准确性,但需更高算力支持(如生成8000个令牌解决复杂问题)。
  • 数据与训练挑战:AI依赖海量数据,强化学习(Reinforcement Learning)通过可验证结果(如数学公式、物理定律)生成合成数据,解决了人类标注的局限性,推动模型训练效率。

2. NVIDIA核心技术与产品

  • Blackwell架构:新一代GPU架构,性能较前代提升30%,体积缩小30%,支持更高能效与计算密度,适用于推理任务。通过NVLink 72技术实现多GPU高速互联,构建超大规模AI工厂(每秒处理百万级令牌)。
  • Dynamo操作系统:专为AI工厂设计的操作系统,协调计算资源,优化预填充(Prefill)与解码(Decode)阶段,支持动态负载分配(如专家并行、流水线并行),提升推理效率40倍。
  • Omniverse与物理AI:通过数字孪生技术模拟物理世界,加速机器人训练与测试。结合生成式AI(如Project GR00T),开发通用人形机器人模型,实现复杂环境下的自主决策与协作。

3. 行业应用与合作伙伴

  • 自动驾驶与汽车安全:NVIDIA与通用汽车(GM)合作开发自动驾驶系统,涵盖训练、模拟与车载AI。安全技术(HALOS)通过第三方评估确保代码安全性,已应用于700万行代码。
  • 通信与边缘计算:与思科、T-Mobile合作构建5G智能网络,利用AI优化信号适应动态环境,提升通信效率。
  • 企业AI转型:推出DGX系列AI服务器(如DGX Station),联合戴尔、惠普等企业,提供从数据中心到边缘的完整AI基础设施,支持金融、医疗、制造等行业的智能化升级。

4. 未来技术路线图

  • 计算架构升级:2024年推出Blackwell Ultra(性能提升1.5倍),2025年发布Vera Rubin架构(CPU性能翻倍,支持NVLink 144),2027年规划Rubin Ultra(算力提升15倍)。
  • 硅光子学与量子计算:采用微环谐振器(MRM)技术降低光模块能耗,支持超大规模数据中心(百万GPU互联);布局量子计算,推动化学、材料科学等领域的模拟加速。
  • AI工厂与能源效率:数据中心向“生成式计算”转型,通过液体冷却、同构架构优化能效,目标将AI工厂的算力密度提升至每机架600千瓦,支撑万亿美元级基础设施建设。

5. 社会影响与愿景

  • 劳动力变革:AI代理(Agents)将重塑企业IT,未来10年或出现百亿数字工作者,协助人类完成设计、优化等任务。
  • 机器人普及:解决全球劳动力短缺(预计缺5000万工人),推动仓储、制造等领域的自动化,人形机器人(如Isaac Lab)通过合成数据与强化学习实现快速技能迭代。

此次GTC大会,英伟达展现了其在AI领域的强大实力和远大愿景。未来,随着AI技术的不断发展和应用,我们将见证更多智能变革的发生,共同开启智能新时代。