标题:2025年GTC大会聚焦智驾技术,英伟达引领端到端解决方案革新
发布日期:2025年3月26日
作者:新皮层NewNewThing 吴一凡
【概览】
随着英伟达2025年GTC大会的盛大开幕,自动驾驶领域再次成为焦点。今年的GTC不仅吸引了AI界的广泛关注,更对整个中国智能驾驶行业产生了深远影响。以下是本次大会中,关于自动驾驶技术的重要动态和趋势分析。
【大会盛况】
3月18日,英伟达的2025年GTC大会如期举行。此次GTC已不再仅仅是AI领域的盛会,它的影响力甚至波及到中国智能驾驶行业的半壁江山——除了特斯拉,目前所有高端智能驾驶方案都依赖于英伟达的Orin芯片提供算力支持。
在GTC智能驾驶分论坛上,理想汽车智驾研发负责人贾鹏、元戎启行CEO周光、小米汽车自动驾驶与机器人部负责人杨奎元、卓驭科技AI首席技术官陈晓智等业界领袖,先后分享了各自在自动驾驶技术方面的最新进展。
【技术趋势】
与往年多样化的技术分享不同,今年的分享内容高度相似。关键词“端到端”、“VLA”、“世界模型”等被频繁提及,反映出当前智能驾驶技术路线正逐渐趋同。自特斯拉率先落地端到端智能驾驶方案以来,这一方案已成为行业主流,理想、小米等企业也凭借该方案实现了跨越式的发展。
【英伟达的智驾方案】
英伟达在PPT中展示了智能驾驶方案的三次升级,从“常规道路”到“非常规道路”再到“特殊场景”。所谓“端到端”,指的是将整个自动驾驶流程整合到统一的神经网络中。这种整合方式提高了智驾系统的效率和实时性,但也带来了可解释性不足和长尾场景处理能力有限的问题。
【世界模型:端到端模型的强化】
为了解决这些问题,业界正在积极探索新的技术方向。其中,“世界模型”概念在GTC大会上被多次提及。这一概念最早源于2018年NIPS会议上一篇论文,它被类比为人类的心智模型,包括对世界的感知和理解、针对当前状态预测未来状态、生成动作三个部分。
世界模型擅长模拟和预测未来的驾驶环境,可以与端到端模型结合,为自动驾驶系统提供更全面的信息,从而解决端到端模型在复杂和罕见场景下决策能力不足、缺乏可解释性的问题。
【VLA:端到端智驾模型的升级】
在GTC大会上,理想汽车推出了新的模型MindVLA,这是一个VLA(Vision-Language-Action,视觉-语言-动作)模型,它在VLM的基础上增加了输出动作指令的能力,可以视作VLM的升级版。
VLA模型本身就是一个端到端模型,它能够根据摄像头、导航等输入信号直接生成车辆的控制指令,并引入语言模型的思维链技术,具备对复杂场景的理解力。
【算力挑战】
随着模型的复杂性增加,对算力的需求也日益增长。在GTC的演讲中,周光透露了一组数据,指出他们家的VLA模型在当前的英伟达智驾芯片上只能达到5FPS,而在下一代智驾芯片上可以达到20FPS。
然而,英伟达下一代智驾芯片Thor的交付日期不断延期,已经成为限制最新智驾方案顺利落地的瓶颈之一。
【结语】
随着智能驾驶技术的不断发展,算力、算法、数据等将成为未来竞争的关键。各大车企纷纷布局自研智驾芯片,以摆脱对英伟达等供应商的依赖,降低成本,并推动智能驾驶技术的进一步发展。
【作者简介】
吴一凡,新皮层NewNewThing成员,专注于智能驾驶和AI领域的研究与报道。
【联系方式】
如有合作或咨询需求,请联系:[邮箱地址]
【免责声明】
本文内容仅供参考,不构成任何投资建议。