Wayve CEO在CVPR 2026上强调自动驾驶是通向10亿机器人的第一块试验田

2026年06月15日 18:09
本文共计4334个字,预计阅读时长15分钟。
来源/OFweek机器人网 责编/NuanxinXiaoMo 暖心小茉

在今年 CVPR 2026 中,自动驾驶具身智能方面的演讲里,Wayve 创始人兼 CEO Alex Kendall也是一个大忙人,在本次CVPR中至少出现在三个研讨会上,做了三场演讲,当然演讲题目都一致《将AI带到10亿台机器人上的前沿挑战》。

通过题目就可知。Wayve没有把自动驾驶讲成一个孤立的汽车工程问题,而是把它放进更大的命题里:如何把 AI 带到 10 亿台真实世界机器人上。这个其实和特斯拉在CVPR演讲(特斯拉 CVPR 2026 演讲全文和详解:把自动驾驶,做成「所有机器人的基础模型」)类似,连标题都类似。

Wayve 本次演讲透露的信息都很鲜明:自动驾驶会成为具身智能的第一条大规模落地路径,而真正可规模化的系统必须具备泛化能力、成本效率、平台化部署能力,以及能在仿真和现实之间持续学习的闭环。

这也是 Wayve 近几年的技术路线一直围绕 “end-to-end AI” 展开,把策略学习、世界模型、风险评估、仿真验证和多车型部署纳入同一套 AI 飞轮。然后做成通用的方案,可以匹配全球不同城市、不同车型、不同传感器和不同成本结构里。目前Wayve的方案已经获得了奔驰、日产、stellantis、uber等定点和应用。

1. AV2.0:从规则栈转向端到端 AI

Wayve 把自动驾驶行业路线分成三代:

AV1.0 是经典模块化栈,强调感知、预测、规划、控制的分工;

AV1.5 在端到端模型外面套规则 checker;

AV2.0 则让端到端模型承担从感知到控制的主要智能,安全能力随 AI 的智能水平共同扩展。这里的关键不是“有没有规则”,而是安全的主语发生了变化。

传统系统把安全主要寄托在人工规则、地图冗余和工程边界上;Wayve 的 AV2.0 认为,真实道路长尾过于复杂,系统必须学会风险,而不是只被规则枚举风险。

Wayve 的2.0方法论:先做强化学习教车开车,再做公开城市道路上的端到端驾驶,再验证同一个 AI 能否迁移到未见过的城市和不同车辆平台,之后进入 LINGO、GAIA 等语言与生成式世界模型方向。

2. 强化学习回归中心:不只是模仿人类驾驶

自动驾驶行业过去几年大量使用模仿学习,因为真实驾驶数据容易收集,行为克隆能快速获得可用策略。

但在这份讲稿里,Wayve 明显把强化学习重新放到了中心位置:数百万小时驾驶经验、大规模多样车队、on-policy/off-policy数据飞轮、多十亿参数 critic 和 world model、大规模多节点 RL 作业,都成为 Wayve 当前训练体系的一部分。

这个其实和之前文章《CVPR 2026 Li Hongyang 演讲的World Engine解读 :可能就是华为说的WE》Li hongyang的理论类似,物理AI 需要学习助力LLM成功的强化学习,而且是具有人类反馈的强化学习。

Alex也在演讲中提到了其“四日循环”,这很能说明 Wayve 想要的研发节奏:周四提出一个关于分布式 critic 的想法,周五实现增量,周末多节点训练,周一完成离线评估并坐进车里 ride-along。这个循环把研究、训练、评估和真实体验压到一个 sprint 内,目标是让模型改进能快速进入真实系统反馈。

强化学习在这里承担两个角色。

第一,它让系统在多智能体交互中学习“不要碰撞、保持进展”等简单但物理约束强的目标。

第二,它为世界模型与仿真验证提供策略优化机制,让 AI 不只是复现数据,而是在可控环境里探索边界情况。

3. GAIA-3:世界模型从“生成视频”走向“训练与验证”

Wayve如何做到强化学习呢?依靠的是其的生成式 AI 路线。其生成式AI大模型GAIA (Generative AI for Autonomy)已经从 GAIA-1 到 GAIA-2,再到本次演讲中的 GAIA-3,方向越来越明确:不是做漂亮的道路视频,而是做可控、可验证、可转移的驾驶世界模型。

GAIA-2 的公开论文标题是 “A Controllable Multi-View Generative World Model for Autonomous Driving”,重点已经包含多视角、高分辨率、地理多样性、可控性和规模。

CVPR 2026 讲稿中的 GAIA-3 则进一步强调四个关键词:真实感、可控性、地理多样性、embodiment transfer。

这背后有一个很重要的判断:传统 procedural simulation 对真实世界具身 AI 来说不够真实,也不够多样。自动驾驶需要处理长尾事故、稀有天气、罕见交通参与者行为、地域差异、传感器差异和平台差异。手工搭建仿真场景很难覆盖这些复杂性,生成式世界模型则可能把真实数据分布、可控反事实和规模化训练统一起来。

Wayve 进一步追问:我们能不能在世界模型里学会驾驶?这其实把自动驾驶训练推向了类似“梦中练习”的框架:模型在现实数据上学习世界,然后策略在世界模型里做大规模试错,再把学到的能力蒸馏回真实车辆可部署的模型中。

4. 安全也要端到端:用模型学习风险,而不是只写规则

那么有了工具之后,如何做好强化学习的奖励函数?具身 AI 的奖励函数到底是什么?手写规则、模仿学习加接管、语言模型、偏好标注、时空物理推理,还是某种新东西?

Wayve 给出的反直觉判断是:既然行业正在接受端到端学习适合驾驶,那么同样的原因也说明端到端学习可能更适合安全和仿真。换句话说,安全系统不应只停留在规则 checker,而应学习风险本身。

反事实重仿真是这条路线的关键工具。Alex在演讲中展示了 NCAP 测试、伦敦减速、湾区变道、日本礼让跑者等案例:模型先在测试中失败,然后通过反事实重仿真生成或重放更关键的场景,再让模型学会通过。

这意味着 Wayve 的安全验证思路不是“现实里遇到一次、线下修一次”,而是把失败场景变成可扩展的训练与验证资产。若 GAIA-3 这样的世界模型能可靠生成 crash scenario 和长尾反事实,安全工程就会从人工案例库走向模型驱动的数据飞轮。

5. 平台化,而不是垂直一体化

介绍完了其方法论和工具之后,Wayve 抛出了他的商业模式猜想:平台会比垂直一体化自动驾驶达到更大规模。

Wayve CEO Alex 里把自动驾驶商业模式分为三类:

自营 robotaxi 车队、Wayve 认为 robotaxi 当前仍是城市级、车队级扩张。

卖车、卖车可以到每年百万辆

授权 AI。而授权 AI 才有机会触达数以亿计的车辆。

所以,显然 Wayve 走的是License AI的 异构平台。他可以在camera-only ADAS、robotaxi 和其他 embodiment 之间的迁移。它想做的不是拥有某一支车队,而是把通用物理 AI 基座训练出来,再通过后训练、蒸馏和压缩落到不同应用。

这个策略的技术含义很强:同一个基础模型需要吸收跨具身、多模态、自监督、离线规模化训练;之后分化成多任务驾驶策略、仿真器、critic;最后压缩到车端硬件,服务 camera-only ADAS、robotaxi 和更多机器人形态。

当然,这也是目前理想、小鹏等新势力产品技术叙事的基础。

6. 成本是技术路线的一部分

Wayve 的第四个观点是:成本很重要。讲稿提出一组很尖锐的问题,例如能否在一小时内虚拟驾驶 1000 万英里来做验证,能否用每车 1000 美元级别的大众市场硬件实现 L5,世界模型能否在嵌入式硬件上实时运行,以及是否会出现物理 AI 的 “MuZero moment”(MuZero是由谷歌旗下人工智能研究公司DeepMind开发的一款计算机程序,旨在无需了解游戏规则和底层机制即可掌握游戏)。

这组问题把 Wayve 的路线与昂贵传感器、重地图、重运营的方案拉开距离。它不是简单地追求更强模型,而是在问:这个模型能否被训练得起、验证得起、部署得起、在足够便宜的量产硬件上跑得动。

在这个框架下,AV2.0 飞轮由部署、数据、训练与验证、智能提升、更多部署构成。部署越多,数据越多;数据越多,训练与验证越强;模型越强,部署边界越大。

7. 为什么 Wayve 认为自动驾驶会先于通用机器人爆发

Wayve CEO Alex演讲后半段把自动驾驶放进具身 AI 的大图景里。Wayve 的第五个判断是:消费者车辆会先于 robotaxi,robotaxi 会先于更广义的 mobility,而这些又会先于 manipulation。

原因并不神秘:驾驶拥有大规模真实数据、成熟硬件、全球供应链、清晰商业价值和相对明确的监管路径。相比之下,家庭机器人和仓储机器人虽然空间巨大,但数据、硬件、成本和任务泛化都更难。

Wayve 从自动驾驶里总结出的经验也很值得机器人行业参考:

不要从过度简化、过度约束的环境开始幻想通用解;

应从一开始就按全球规模设计,优先处理最难的问题;

必须建立大规模数据收集和自监督学习策略;

不要轻易假设新造机器人或大规模资本开支能快速改造行业;

更现实的路线可能是把智能装进已有系统。

这正是 Wayve Labs 的背景。最后alex 在结尾宣布 Wayve Labs,研究方向包括世界模型、模型化强化学习、跨具身学习、大规模训练、奖励模型、空间智能、语言用于具身 AI、策略学习、蒸馏和压缩等。

结语:Wayve 的真正野心不是自动驾驶,而是可规模化的物理 AI

这场 CVPR 2026 演讲的核心可以压缩成一句话:Wayve 把自动驾驶当作训练、验证和部署通用物理 AI 的第一条产业级路径。

它的最新技术观点包括:

端到端学习不只是驾驶策略问题,也应进入安全、仿真和验证。

泛化能力是规模、安全和商业模式的共同前提。

世界模型会从生成视频变成训练、反事实重仿真和长尾验证的基础设施。

强化学习、critic、世界模型和真实车队数据会构成持续迭代的 AI 飞轮。

平台化授权有机会比自营 robotaxi 更快触达亿级车辆。

成本、车端算力和硬件约束不是商业问题,而是模型路线必须内生解决的技术问题。

自动驾驶可能是具身智能最先规模化的应用,再向更广义机器人迁移。

从这次CVPR 2026 里面特斯拉的演讲、Wayve的演讲,Physical AI已经确立了基础模型+强化学习通吃的方法论。

所以,这里可能给所有做自动驾驶和具身智能这类Physical AI行业的人提了个醒:如果想要从底层算法方面做好自动驾驶就应该站位整个物理AI,重点研发好大模型。如果只是想场景落地,那么就抓住一个通用大模型进行应用打磨。自动驾驶和具身智能单场景自研的时代已经落幕。

参考资料以及图片Frontier challenges bringing AI to 1B Robots,alex,CVPR 2026 Workshop(丹佛)。

       原文标题 : CVPR 2026 Wayve 的最新判断:自动驾驶是通往 10 亿机器人的第一块试验田

来源:CVPR 2026 Wayve 的最新判断 : 自动驾驶是通往 10 亿机器人的第一块试验田 | OFweek机器人网

声明:本文来自OFweek机器人网,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/