智驾领域的变化真的很快,感觉VLA才刚落地没多久,2025年下半年行业的焦点之一就已经是卷VLA上车速度。
去年突然在智驾上“开窍”的长城汽车,在这一轮竞速中跟进动作迅速。
广州车展上,长城正式发布搭载VLA的全新一代辅助驾驶系统——Coffee Pilot Master(简称CP Master),并宣布魏牌是首搭车型;
才不到两周的时间,长城便公布结果,全新蓝山智能进阶版成为了长城VLA的首搭车型。
目前,长城VLA已进入实车测试验证阶段。
长城也没藏着掖着,直接在总部保定举办了一场直播,公开了长城VLA的测试过程,并请来了最近互联网上的“大红人”——影视飓风Tim,和长城汽车CTO吴会肖进行了一次深度会谈,首次向外界展示长城VLA的真实能力。
那么,长城VLA的实际表现究竟如何?相较上一代系统有何提升?其技术路线背后又蕴含着怎样的设计逻辑?
我是看完直播后,又复盘了一遍回放,下面就给大家具体来聊聊长城VLA这套系统的表现,以及长城在VLA技术路径上的思考。
01
长城VLA全网公开首测:比上一代更“游刃有余”
首先需要说明的是,这一次的测试路段选在保定的新老城区,包括快速路、人车混行、无保护路段、大型复杂路口等复杂路况,基本上涵盖目前城市驾驶最典型、也最考验辅助驾驶能力的场景,所以能够比较真实的反映这套系统的能力。
VLA上车后,长城全新一代CP Master其实还是有不少提升和亮点的,主要如下:
一、更善解人意。
驾驶员可以语音直接激活NOA,而且系统能够识别和执行更复杂的指令,比如“帮我起步”“离旁边的大车远一点”等,而且只响应驾驶员的指令,避免车内其他乘员的干扰。
二、更接近老司机。
这套系统整体的调校不算很激进,面对突发事件应对也更柔和,会更贴近老司机的稳健驾驶风格。
比如直播中有两个场景,一个是有围挡的复杂施工路段,另一个是前方突然有大型扫地车横穿马路,系统会先降速,而且动作丝滑,没有突然的急减速。
此外,驾驶员突然发出右转的指令后,系统也能够很快识别并顺滑并入右转车道,没有压实线,且及时打灯,无任何违规操作。
进入保定老城区后,路况变得复杂,没有专门的非机动车道,道路也比较窄,而且有些人行道路口还没有红绿灯,对智驾挑战非常大,但是系统应对依旧很从容,面对行人横穿还有礼让行人的动作,刹车也比较柔和。
三、更安全。
当系统预判到风险时,会主动切换至“防御性驾驶”状态,导航界面也会变为紫色。
比如直播中,测试车辆前方突然出现了不打灯加塞的社会车辆,系统随即开启防御性驾驶,保持自然车距。吴会肖表示,防御性驾驶的目的是让系统学会害怕,这是长城VLA最核心的价值和意义。
四、更具信任感。
VLA这次带来的另一个比较大的变化,就是推理过程的可视化。
具体就是,系统从感知到推理的全部思考过程都能够显示在中控屏 CoT(思维链)卡片流上,上一代版本还做不到这点,而VLA技术直接打破了辅助驾驶“黑盒”状态,这样做的好处是可以提高驾驶员对系统的信任感,驾驶员知道系统是怎么想的、接下来会怎么操作。
五、更强大的算力。
除了VLA上车,蓝山智能进阶版此次在硬件层面也同步进行了升级,全车搭载27个智慧传感器,并采用NVIDIA DRIVE Thor-U芯片,算力实现176%的冗余提升,能够流畅支撑VLA大模型上车实时运算。
整体来看,相比上一代CP Ultra,基于VLA大模型的全新一代CP Master辅助驾驶系统,推理能力和理解都更强,成熟度大大提升。
用吴会肖的话来说就是,去年还有点“匆匆忙忙”,今年已经是“游刃有余”。
02
对谈影视飓风Tim:长城VLA的强大在于“学会害怕”
这次直播,除了展示长城VLA的能力,另一个重点的是梳理了长城辅助驾驶的发展历程,以及其对VLA的思考。
借着影视飓风Tim之口,长城回应了外界对其辅助驾驶布局的诸多好奇。
其实长城在辅助驾驶上的研发投入非常激进,而且起步很早,十多年前就从主动安全部门分出一波人来做辅助驾驶。
最近几年,长城在辅助驾驶上进展加速,技术路线也逐渐清晰:
2021年,推出高速NOH;
2022、2023 年,当行业仍把精力放在高精地图方案上时,长城选择All in无图路线,因为考虑到高精地图过度依赖地图,后续更新速度和体验都不如无图方案,难以做到真正意义上的“全国都能开”。
去年4月发布的CP Ultra,又实现了城市NOA+高速NOA的车位到车位全场景覆盖,累计护航里程超2.43亿公里,用户渗透率高达96.7%。
仅仅一年半的时间,又实现了VLA大模型在魏牌全新蓝山智能进阶版的快速上车。
如今,长城已经基本确定了VLA技术路线。
从端到端升级至VLA,长城并不是突然切换,而是早有预谋。
在长城看来,端到端是辅助驾驶进化道路上必经的一站,但不是终点。
理由是,端到端模型天然有局限,比如无法识别道路信息及理解真实世界场景信息,而且推理过程是“黑盒”状态,无法解释自己是如何做出决策的。
但长城真正的思路转变源于2023年谷歌DeepMind团队发布的一篇名为《RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control》的论文,感兴趣的朋友可以自行搜索。
这篇论文首次正式提出了VLA模型概念,创新性将互联网规模数据上训练的视觉语言模型整合到机器人控制中,证明了大模型的“理解能力”可以与机器人的“执行能力”高度融合,使AI具备在真实世界中解决复杂任务的能力。
所以VLA模型最早其实见于机器人行业,谷歌DeepMind发布的RT-2模型,就是全球首个控制机器人的视觉语言动作VLA模型,只不过后来的VLA模型概念更快在智驾领域上应用落地。
这并不难理解,在吴会肖看来,VLA是一个面向具身智能的通用底座模型,智能汽车的本质就是一个具身智能。只不过相比人形机器人,汽车自由度更低、场景更规则,因此VLA反而更容易在车上落地。
这也是长城最终确定VLA技术路线的根本原因。
至于长城VLA与其他车企的差别,吴会肖强调,大家算法架构的底层逻辑都是相似的,不同主要体现在对VLA价值的理解。
而长城VLA的价值,核心便是“安全”,关键在于“让AI学会害怕”。长城的防御性驾驶就是基于这种逻辑,正如老司机往往是最怕出事的,所以开车一般都是“稳如老狗”。
推理过程可视化是另一个关键点。过去端到端是黑盒,用户不知道系统在想什么。VLA让系统的思维链路在中控屏上完整呈现,从感知到推理再到动作都有迹可循,这能显著提升用户的信任感。
在功能设计上,长城的态度则会更加克制。例如国外流行的“招手即停”功能,长城内部试过,但上车前被最终否决,因为系统无法判断招手的人是不是坏人。
在长城看来,技术有两面性,不能只看到技术炫酷的一面,还要看到风险的一面。因此每一项功能上车前都必须想清楚AB面,并把安全作为永远的底线。
关于价值观与技术的关系,吴会肖认为,价值观是技术的指导方向,首先要建立技术价值观,给技术系上安全带。
此外,关于行业目前VLA和世界模型的争议,吴会肖也持更乐观的态度,她认为有争辩很正常,这说明辅助驾驶技术还在不断演进。
而且长城的看法是,VLA和世界模型的关系不是分化,而是协同。
理由是,VLA是车端大脑,世界模型是云端训练场,两者互相增益。车端产生的真实数据能不断反哺世界模型,而世界模型又能为VLA提供更多接近真实世界的经验。协同演进,远比二选一更现实。
总结来说就是,长城对于辅助驾驶的态度,一方面在技术上激进,另一方面在商业化落地上保持克制,把用户价值放在第一位,而不是追求噱头。
03
驾仕结语:
最后再简单说说为什么蓝山会成为长城VLA的首搭车型。
吴会肖表示,因为蓝山对于长城有着特殊意义。
去年4月,CP Ultra辅助驾驶系统也是在蓝山上进行了首次直播实测,同年6月,最新一代智能座舱Coffee OS3又首搭蓝山。可以说,蓝山开启了长城智能化的新起点。
对魏牌自身而言,蓝山同样是一道分水岭,是魏牌为用户转变的重要里程碑,之前我们也分析过,是“双山系列”的推出,让魏牌进入第二阶段的彻底变革。
而且蓝山目前累计销量已突破10万,成为魏牌的销量压舱石。作为旗舰 SUV,蓝山承载着家庭用户最高的安全期待,因此让它成为长城VLA的首搭车型,也就顺理成章。
而接下来的看点在于,在VLA上车之后,蓝山能否再上一个销量台阶。让我们拭目以待。
(END)