小鹏来「交卷」了。
2024年,在1024科技日上,小鹏汽车副总裁、自动驾驶负责人李力耘博士表示,自动驾驶新一轮竞争正在云端展开。
他认为,从智驾竞争的终局来看,布局云端大模型才是制胜关键。而小鹏汽车早在预研端到端大模型的阶段,就笃定要先构建一个强大的「云端大模型」。
最近,小鹏拿出了他们最新的进展。4月14日技术分享会上,小鹏分享了其在AI大模型方面的最新进展,并正式提出了「世界基座模型」的概念 。
与部分同行侧重于在车辆端直接应用VLA模型的发展路径不同,小鹏汽车的策略是,首先在云端训练一个更大规模的基座模型,然后通过知识蒸馏的方法,将模型所学习到的驾驶能力传递到车辆端 。小鹏汽车方面认为,这种方法旨在突破车辆端计算资源对模型复杂度和性能的限制,从而提升自动驾驶系统的整体能力 。
「云端基座模型」是小鹏汽车AI战略中的一项关键技术,那么,它具体指什么?它将如何影响智驾的未来发展?
2024年,端到端大模型成为智能驾驶领域备受关注的技术方向。针对端到端模型的实现路径,目前行业内主要有三种路径:
- 小模型堆叠:小鹏曾经考虑,在每一个模块中都引入AI模型,再通过一些规则和算法,让每个模块的AI模型有机结合起来。「但这样的方法仍然需要很多规则时代的工程师去定制接口,进行拼接和串联。」李力耘说道。
- 车端大模型:自下而上地在车端去构建网络来解决问题的方法,但是众所周知,车端算力是有限的,车端大模型也有着「见效快,但上限低」的缺点。
- 云端大模型:这也是小鹏目前采用的方案。李力耘称,只有突破硬件的限制,真正的探索能力的上限才是智驾的制胜关键——云端大模型往往比车端模型有着几十甚至百倍的参数可以去消耗。
当前,部分主流车企倾向于采用在车辆端部署大模型的技术路线。在很多场景下车端的端到端模型,确实已经能够提供类似老司机一样的体验,但小鹏为啥仍然要投入巨大的资源去做云端的基座模型呢?
小鹏汽车认为,车辆端算力限制了模型的大小和可处理的数据量。为了探索自动驾驶能力的上限,需要突破车端芯片算力的限制,利用更大规模的模型和海量数据,以更简洁有效的方式实现车辆的智能化。而云端大模型就是最好的选择。
小鹏汽车的这一策略与特斯拉、OpenAI等AI领域企业的某些发展思路存在共通之处。据李力耘透露,过去一年,小鹏汽车的研发团队已开发了参数量分别为20亿、70亿和720亿的基座模型,并正在推进720亿参数的世界基座模型的研发。这一参数规模显著高于主流VLA模型。
受限于当前主流车端芯片的算力,车端模型的参数规模通常在1亿到5亿之间,而业界关注的VLA模型,其参数规模约为20亿。这是因为自动驾驶模型需要综合处理视觉信息、进行推理并输出动作指令,因此是一个复杂的大型模型。
小鹏汽车的世界基座模型,其核心并不侧重于语言大模型(LLM)本身,而更强调通过多模态传感器数据的融合和对齐,使模型具备推理能力、思维能力和链式思维能力(CoT)。通过这种方式,模型能够对复杂场景进行逻辑推理,并将推理结果转化为对车辆的控制指令。
为了开发小鹏世界基座模型,小鹏汽车打造了一座「云端模型工厂」,工厂「车间」涵盖基座模型预训练和后训练(强化学习训练)、模型蒸馏、车端模型预训练到部署上车的完整生产链路。
小鹏汽车在云端训练大规模的基座模型,并采用后训练的强化学习、模型蒸馏等技术,生成更大规模的车端模型,该模型被称为XVLA,并部署到车端 。
简而言之,小鹏汽车的策略是在云端训练一个大规模的预训练模型,通过强化学习使其成为一个高性能的“教师”模型,然后通过知识蒸馏,将学习到的能力传递给车端的“学生”模型。
在人工智能领域,算力与数据和算法、模型同等重要。为了支持基座模型的研发,小鹏汽车已建成一个万卡规模的智能计算集群,算力达到10 EFLOPS,集群运行效率保持在较高水平。
小鹏汽车世界基座模型负责人刘博士介绍,目前,用于训练基座模型的视频数据量已达到2000万clips,并计划在今年内将数据量提升至2亿clips。 每个clips可以理解成大约一分钟的小电影。
小鹏是Scaling Law的忠实信徒。虽然最近很多AI前沿工作说Scaling Law、预训练遇到了瓶颈。但从算力、数据量来看,自动驾驶的Scaling Law还有很大红利。
关于数据方面,尽管互联网优质数据大概600-700T之后会出现瓶颈,但由于智能驾驶领域的大部分企业从2024年才逐步转向端到端模型,因此,自动驾驶领域仍有大量高质量驾驶数据。
此外,无论是车辆端还是云端的计算能力,以及模型的参数规模,预计都将持续增长,这为自动驾驶领域的规模法则提供了进一步发展的空间。
目前来看,小鹏已经取得回报。据了解,小鹏团队首次验证了规模法则在自动驾驶领域持续生效,小鹏世界基座模型负责人刘博士表示:「过去一年,我们做了大量实验,在10亿、30亿、70亿、720亿参数的模型上都看到了明显的规模法则效应:参数规模越大,模型的能力越强。同样的模型大小,训练数据量越大,模型的能力也会越强。」
同时,小鹏汽车已经进行了“基座大模型控车”的实车测试,并在后装算力的车辆端,使用小尺寸基座模型实现了车辆控制。小鹏汽车方面表示,虽然这仍处于早期测试阶段,但基座模型已经展现出了一定的驾驶能力 。
小鹏汽车的目标是在今年下半年推动L3级自动驾驶进入商业化初期,并计划在2026年探索L4级自动驾驶 。
小鹏汽车在AI驱动自动驾驶的道路上,正以其独特的「云端大模型+知识蒸馏」的技术路线,迈入一个全新的发展阶段。从对Scaling Law的坚持,到「云端模型工厂」的构建,再到「世界基座模型」的发布,小鹏汽车展现了其在AI技术领域的持续投入和前瞻布局。
还没有评论,来说两句吧...