XR发现机器人数据增量市场
文/VR陀螺 Wickey
2026年,VR/MR头显设备正在以一种超出预期的方式成功实现了新的市场方向的开辟工作。
这一次,推动增长的驱动力既不来源于游戏娱乐,也不来源于大空间体验,而是转向了近年来讨论热度持续攀升的具身智能与机器人领域。
今年3月,大朋(DPVR)发布了「RoboPilot」机器人遥操训练方案,从而将VR技术直接嵌入到机器人远程控制以及训练链路之中;5月,小派科技与上海城市设计与城市科学重点实验室签署课题合作协议,共同建设下一代具身智能数据平台;6月初,PICO宣布联合英伟达推出基于Isaac平台的开源机器人遥操作方案「Isaac Teleop」,把XR设备接入到机器人仿真与训练体系当中。
多家VR/MR厂商在上半年相继公布具身智能相关方案和合作,并非巧合。一方面得益于具身智能产业的高速增长,机器人来到了需要进行实际训练与落地的新阶段,另一方面,沉寂已久的VR/MR产业也需要新变量,而具身智能所需的技术与VR/MR硬件所具备的能力不谋而合。
01 C端增速放缓,XR转战具身智能
2026年,VR/MR厂商几乎同时把目光投向了具身智能领域,这成为他们宣发工作重点的一个原因在于原有消费市场的增长已经达到了上限,因此需要引入新的增长曲线。
根据陀螺研究院所提供的数据,2025年全球VR头显(含MR)出货量约为475万台,同比下降约35%。VR/MR头显的换机周期普遍在3至5年甚至更久,用户复购率远低于智能手机等其他消费电子品类,因此纯C端的销售模式所存在的上限较为明显。
VR/MR头显除了换机周期这一问题,内容方面也同样遭遇到了困境,依据陀螺研究院提供的数据,2025年全球约有20家VR游戏相关工作室宣布裁员;时间来到2026年,仅5月就有两家VR游戏工作室关闭。而大空间面临的是内容题材雷同,体验无创新,这直接导致很多大空间门店客流在开业3个月后急剧下滑。当新鲜感过去后,依靠内容生态拉动硬件销量,这条路相比前几年越来越难。
这也迫使VR/MR厂商不得不去探索其他路径,长期以来XR产业所积累的空间定位、多传感器融合、环境建模以及低延迟运动追踪等关键技术,不仅构成了XR设备得以实现沉浸式体验的技术基础,同时也是具身智能完成自主行动的必要条件。由于这些技术已在消费级市场经历了多年的迭代验证过程,其技术成熟度以及工程化能力会明显优于实验室阶段的新兴方案。相关的XR技术可以复用于具身智能领域,这也为二者的结合提供了基础。
今年4月北京亦庄人形机器人半程马拉松中,近四成参赛机器人运用自主导航方案,其背后所依赖的正是空间感知、多传感器融合等能力。这些原本大量应用于XR设备的技术,如今正在机器人领域得到验证。除了空间感知方面复用XR技术,机器人训练过程也与XR实现了深度绑定。
02 借助XR遥操作来解决机器人训练数据采集的最后一公里
在具身智能训练过程当中,数据采集工作所面临的问题会成为制约模型性能提升以及最终落地效果的关键所在。VR以及MR厂商所积累的空间定位、多传感器融合以及低延迟运动追踪等技术,得以在这一领域发挥核心作用。
操作人员运用XR设备进行远程操控的时候,可以把自身的认知决策以及动作过程自然映射到机器人本体之上,从而成功采集到与实际执行紧密对应的多模态示范数据。这些数据包含了视觉信息、关节状态以及力反馈的完整对应关系,这对于后续的模仿学习模型训练而言具备了不可或缺的价值。
今年3月大朋所发布的RoboPilot方案,借助其PCVR头显的高精度追踪能力,成功实现了对机器人运动的实时控制以及训练数据的同步记录工作。小派科技与上海城市设计与城市科学重点实验室之间的合作协议,则以建设下一代具身智能数据平台为基础,来开展系统性的数据采集以及处理相关工作。6月初PICO联合英伟达推出的Isaac Teleop开源方案,把XR设备接入到Isaac平台当中,得以在仿真环境以及真实机器人系统之中统一进行数据采集操作。
这些不同方案的集中出现,体现了XR技术与具身智能训练之间所存在的深度绑定关系。原本应用于消费市场的成熟技术,现在正被复用到机器人数据采集链路之中,从而帮助行业跨越长期存在的数据瓶颈问题。
北京亦庄人形机器人半程马拉松的参赛情况已经表明,近四成机器人所运用的自主导航方案,其背后所依赖的正是空间感知以及多传感器融合等能力。这些原本大量应用于XR设备的技术,如今正在机器人训练领域得到充分验证以及应用。
近期,优必选Walker C1、英伟达与宇树合作的Isaac GR00T、越疆陪伴交互AI人形机器人、阿里Qwen-Robot系列以及节卡JAKA π仔等具身智能机器人相继正式亮相。人形机器人已经逐步走出技术验证阶段,然而目前数据量不足的状况,仍然限制具身智能大模型训练工作的进一步发展。
与大语言模型能够直接借助互联网资料开展工作不同,机器人并不具备天然的数据来源。其中抓取、搬运、避障以及力度控制等行为,只能依赖于真人示范来完成获取工作。传统规则编程、遥操作或仿真强化学习均难以完整复现三维空间当中的自然动作与决策过程。
XR遥操作由此进入了产业视野。操作人员借助VR/MR头显得以获得机器人的第一人称视角,运用手柄、动捕设备等交互工具,把头部、手部乃至身体的完整动作实时映射至机器人本体之上,从而成功实现了沉浸式远程控制。相比传统摇杆加监控屏方案,XR遥操作可以同步记录操作者的头部姿态、手部动作以及控制指令,为机器人训练来生成更完整的人类操作数据。
以大朋「RoboPilot」方案为例,该方案以PCVR架构为基础,实时采集操作者头部与双手的6DoF位姿信息并同步传输至机器人控制系统,从而成功形成了“采集—传输—控制—反馈”的完整链路。同时,系统还能持续记录头部轨迹、双手动作、控制指令以及机器人执行结果,进而形成了全方位的真人操作数据。该方案进一步减少了XR遥操作的成本,提高了操作的便捷性。
与此同时,PICO联合英伟达推出的「Isaac Teleop」进一步推动了标准化进程。该方案支持统一设备接口、自动数据录制工作以及仿真与现实共用同一套代码栈,从而使XR遥操作的价值从“远程控制机器人”延伸至“持续生产训练数据”这一环节。
XR技术在机器人训练以及控制方面所进行的探索工作,在近几年来得以快速扩散,而机器人厂商也正在积极融入这一趋势。宇树科技开源项目之中已出现多个与遥操作以及数据采集相关的模块,其中包括面向XR设备的人形机器人遥操作框架、XR视觉与手柄控制接口,以及与LeRobot训练框架打通的数据采集方案,关注重点已延伸至“数据采集—模型训练—开发者复用”的完整链路。
同时,学界也在进一步探索,北京智源人工智能研究院今年5月发表的BifrostUMI方案则尝试将“机器人在场采集”转变为“人类先示范、机器人后学习”——采集现场无需绑定机器人,运用轻量化VR设备对人类动作轨迹与视觉信息进行采集,再借助动作重定向以及全身控制系统把所采集内容转化为机器人可执行动作,从而进一步降低了真机参与采集的成本。
03 告别边缘化争议,XR仍是具身智能进化关键
过去几年当中,XR产业一直面临着边缘化争议。消费市场出货量出现明显下滑、内容工作室遭遇裁员或关闭、大空间项目客流快速减少,这些情况让外界普遍认为XR技术难以突破小众娱乐定位。然而,2026年多家VR以及MR厂商集中布局具身智能领域的工作,成功改写了这一叙事。XR所积累的空间计算、多传感器融合以及低延迟运动追踪等核心能力,得以在具身智能从感知到行动的完整链路之中发挥关键作用。
具身智能的进化高度依赖高质量多模态示范数据的持续供给。不同于大语言模型能够直接借助互联网资料开展工作,机器人并不具备天然的数据来源。其中抓取、搬运、避障以及力度控制等行为,只能依赖于真人示范来完成获取工作。传统规则编程、遥操作或仿真强化学习均难以完整复现三维空间当中的自然动作与决策过程。XR遥操作由此进入了产业视野。操作人员借助VR以及MR头显得以获得机器人的第一人称视角,运用手柄、动捕设备等交互工具,把头部、手部乃至身体的完整动作实时映射至机器人本体之上,从而成功实现了沉浸式远程控制。相比传统摇杆加监控屏方案,XR遥操作可以同步记录操作者的头部姿态、手部动作以及控制指令,为机器人训练来生成更完整的人类操作数据。
以大朋所发布的RoboPilot方案为例,该方案以PCVR架构为基础,实时采集操作者头部与双手的6DoF位姿信息并同步传输至机器人控制系统,从而成功形成了“采集—传输—控制—反馈”的完整链路。同时,系统还能持续记录头部轨迹、双手动作、控制指令以及机器人执行结果,进而形成了全方位的真人操作数据。该方案进一步减少了XR遥操作的成本,提高了操作的便捷性。与此同时,PICO联合英伟达推出的Isaac Teleop进一步推动了标准化进程。该方案支持统一设备接口、自动数据录制工作以及仿真与现实共用同一套代码栈,从而使XR遥操作的价值从远程控制机器人延伸至持续生产训练数据这一环节。
这些不同方案的集中出现,充分体现了XR技术与具身智能训练之间所存在的深度绑定关系。原本应用于消费市场的成熟技术,现在正被复用到机器人数据采集链路之中,从而帮助行业跨越长期存在的数据瓶颈问题。北京亦庄人形机器人半程马拉松的参赛情况已经表明,近四成机器人所运用的自主导航方案,其背后所依赖的正是空间感知以及多传感器融合等能力。这些原本大量应用于XR设备的技术,如今正在机器人训练领域得到充分验证以及应用。
近期,优必选Walker C1、英伟达与宇树合作的Isaac GR00T、越疆陪伴交互AI人形机器人、阿里Qwen-Robot系列以及节卡JAKA π仔等具身智能机器人相继正式亮相。人形机器人已经逐步走出技术验证阶段,然而目前数据量不足的状况,仍然限制具身智能大模型训练工作的进一步发展。XR技术在机器人训练以及控制方面所进行的探索工作,在近几年来得以快速扩散,而机器人厂商也正在积极融入这一趋势。宇树科技开源项目之中已出现多个与遥操作以及数据采集相关的模块,其中包括面向XR设备的人形机器人遥操作框架、XR视觉与手柄控制接口,以及与LeRobot训练框架打通的数据采集方案,关注重点已延伸至“数据采集—模型训练—开发者复用”的完整链路。
同时,学界也在进一步探索,北京智源人工智能研究院今年5月发表的BifrostUMI方案则尝试将“机器人在场采集”转变为“人类先示范、机器人后学习”——采集现场无需绑定机器人,运用轻量化VR设备对人类动作轨迹与视觉信息进行采集,再借助动作重定向以及全身控制系统把所采集内容转化为机器人可执行动作,从而进一步降低了真机参与采集的成本。
通过与具身智能的深度融合,XR产业得以告别长期以来的边缘化争议,重新确立了自身在下一代人工智能体系之中的战略地位。那些在消费时代积累的空间计算与交互能力,正在以生产力工具的新身份,驱动具身智能从实验室走向真实世界的规模化落地。
不过,在机器人训练的实际过程当中,XR遥操作也并非被业界所公认的最优方式。
这一表述体现了当前产业界对数据采集路径的理性评估。尽管XR遥操作能够借助成熟的空间追踪与沉浸式交互来高效映射人类决策,但其在吞吐量、触觉完整性以及长期规模化方面仍存在结构性制约,需要与仿真增强、视频预训练以及混合策略形成互补,才能共同驱动具身智能的进一步演进。
2025年6月,特斯拉Optimus开始对VR遥操作方案进行弱化处理,转而选用第一视角多摄像头采集的方式,从而让模型得以直接学习人类的行为轨迹。这一转向与其FSD纯视觉路线保持着一脉相承的关系,旨在降低对外部设备的依赖,扩大数据采集的规模并且提高采集工作的效率。
。
然而,这并不意味着XR遥操作所具备的价值遭到了否定。无论是XR遥操作、动作捕捉,还是第一视角视频采集,这些方式本质上都在致力于解决同一个根本问题,也就是如何能够持续获得高质量的机器人训练数据。
不同方案各自具备不同的侧重点,特斯拉所进行的转向举措成功凸显了实现规模化数据采集的另一种可能,这同样得益于特斯拉在智能驾驶领域所长期积累的结果。以成本以及技术实现难度方面的考量为基础,并非所有厂商都可以直接对这一方式进行复用。
XR遥操作在装配、精密抓取以及工具使用等需要进行高自由度控制与实时反馈的任务当中,仍然具备不可替代的优势。它不仅可以精准映射操作者的行为动作,还能够捕捉决策过程当中的时序信息,这是纯视觉方案所难以完整覆盖的部分。
因此在实际训练场景当中,XR遥操作往往与视觉采集方案并行运用——前者侧重于提供高精度示范数据,后者侧重于开展规模化积累工作,二者形成了互为补充而非替代的关系。随着具身智能模型的发展,不同来源的数据将会进一步整合到统一的训练框架之中,共同提升机器人的智能度。
随着数据量的持续积累,模型得以逐渐从模仿特定动作的阶段,进化到理解动作语义的更高层次。遥操作所占的比例也将随之逐步降低,而机器人自主决策的比例则会相应提升。而这一切演进过程的起点,正是当下对每一帧遥操作数据的系统性积累。
04 写在最后
XR与具身智能的结合,得以实现两个产业在技术演进过程当中所进行的一次重要交汇。
2026年上半年,VR/MR厂商密集布局具身智能领域:3月大朋推出RoboPilot机器人遥操训练方案,5月小派科技与上海城市设计与城市科学重点实验室签署课题合作协议共同建设下一代具身智能数据平台,6月初PICO联合英伟达推出基于Isaac平台的开源机器人遥操作方案Isaac Teleop,把XR设备接入到机器人仿真与训练体系当中。这些动作的集中出现,依赖于具身智能产业的高速增长以及消费级XR市场所面临的增长上限。
根据陀螺研究院所提供的数据,2025年全球VR头显含MR出货量约为475万台,同比下降约35%。VR/MR头显的换机周期普遍在3至5年甚至更久,用户复购率远低于智能手机等其他消费电子品类,因此纯C端的销售模式所存在的上限较为明显。内容方面也同样遭遇困境,2025年全球约有20家VR游戏相关工作室宣布裁员,2026年5月就有两家VR游戏工作室关闭。大空间内容题材雷同且体验缺乏创新,导致很多门店客流在开业3个月后急剧下滑。这些情况迫使VR/MR厂商探索新的路径。
XR产业所积累的空间定位、多传感器融合、环境建模以及低延迟运动追踪等关键技术,不仅构成了XR设备得以实现沉浸式体验的技术基础,同时也是具身智能完成自主行动的必要条件。这些技术已在消费级市场经历了多年的迭代验证,其成熟度以及工程化能力明显优于实验室阶段的新兴方案。北京亦庄人形机器人半程马拉松中近四成参赛机器人运用自主导航方案,其背后所依赖的正是这些原本大量应用于XR设备的技术。
具身智能训练过程当中数据采集工作所面临的问题成为制约模型性能提升以及最终落地效果的关键所在。操作人员运用XR设备进行远程操控的时候,可以把自身的认知决策以及动作过程自然映射到机器人本体之上,从而成功采集到与实际执行紧密对应的多模态示范数据。这些数据包含视觉信息、关节状态以及力反馈的完整对应关系,对于后续的模仿学习模型训练而言具备不可或缺的价值。
大朋所发布的RoboPilot方案借助其PCVR头显的高精度追踪能力,成功实现了对机器人运动的实时控制以及训练数据的同步记录工作。小派科技与上海城市设计与城市科学重点实验室之间的合作协议以建设下一代具身智能数据平台为基础来开展系统性的数据采集以及处理相关工作。PICO联合英伟达推出的Isaac Teleop开源方案把XR设备接入到Isaac平台当中,得以在仿真环境以及真实机器人系统之中统一进行数据采集操作。这些方案的出现体现了XR技术与具身智能训练之间所存在的深度绑定关系。原本应用于消费市场的成熟技术现在正被复用到机器人数据采集链路之中,从而帮助行业跨越长期存在的数据瓶颈问题。
近期优必选Walker C1、英伟达与宇树合作的Isaac GR00T、越疆陪伴交互AI人形机器人、阿里Qwen-Robot系列以及节卡JAKA π仔等具身智能机器人相继正式亮相。人形机器人已经逐步走出技术验证阶段,然而目前数据量不足的状况仍然限制具身智能大模型训练工作的进一步发展。不同于大语言模型能够直接借助互联网资料开展工作,机器人并不具备天然的数据来源。其中抓取、搬运、避障以及力度控制等行为只能依赖于真人示范来完成获取工作。传统规则编程、遥操作或仿真强化学习均难以完整复现三维空间当中的自然动作与决策过程。
XR遥操作由此进入产业视野。操作人员借助VR/MR头显得以获得机器人的第一人称视角,运用手柄、动捕设备等交互工具把头部、手部乃至身体的完整动作实时映射至机器人本体之上,从而成功实现了沉浸式远程控制。相比传统摇杆加监控屏方案,XR遥操作可以同步记录操作者的头部姿态、手部动作以及控制指令,为机器人训练生成更完整的人类操作数据。宇树科技开源项目之中已出现多个与遥操作以及数据采集相关的模块,其中包括面向XR设备的人形机器人遥操作框架、XR视觉与手柄控制接口以及与LeRobot训练框架打通的数据采集方案,关注重点已延伸至数据采集—模型训练—开发者复用的完整链路。
北京智源人工智能研究院今年5月发表的BifrostUMI方案则尝试将机器人在场采集转变为人类先示范、机器人后学习——采集现场无需绑定机器人,运用轻量化VR设备对人类动作轨迹与视觉信息进行采集,再借助动作重定向以及全身控制系统把所采集内容转化为机器人可执行动作,从而进一步降低了真机参与采集的成本。
通过与具身智能的深度融合,XR产业得以告别长期以来的边缘化争议,重新确立了自身在下一代人工智能体系之中的战略地位。那些在消费时代积累的空间计算与交互能力,正在以生产力工具的新身份驱动具身智能从实验室走向真实世界的规模化落地。
不过在机器人训练的实际过程当中,XR遥操作也并非被业界所公认的最优方式。这一表述体现了当前产业界对数据采集路径的理性评估。尽管XR遥操作能够借助成熟的空间追踪与沉浸式交互来高效映射人类决策,但其在吞吐量、触觉完整性以及长期规模化方面仍存在结构性制约,需要与仿真增强、视频预训练以及混合策略形成互补,才能共同驱动具身智能的进一步演进。
2025年6月特斯拉Optimus开始对VR遥操作方案进行弱化处理,转而选用第一视角多摄像头采集的方式,从而让模型得以直接学习人类的行为轨迹。这一转向与其FSD纯视觉路线保持着一脉相承的关系,旨在降低对外部设备的依赖,扩大数据采集的规模并且提高采集工作的效率。然而这并不意味着XR遥操作所具备的价值遭到了否定。无论是XR遥操作、动作捕捉还是第一视角视频采集,这些方式本质上都在致力于解决同一个根本问题也就是如何能够持续获得高质量的机器人训练数据。不同方案各自具备不同的侧重点,XR遥操作在装配、精密抓取以及工具使用等需要进行高自由度控制与实时反馈的任务当中仍然具备不可替代的优势。它不仅可以精准映射操作者的行为动作,还能够捕捉决策过程当中的时序信息,这是纯视觉方案所难以完整覆盖的部分。因此在实际训练场景当中XR遥操作往往与视觉采集方案并行运用,前者侧重于提供高精度示范数据,后者侧重于开展规模化积累工作,二者形成了互为补充而非替代的关系。随着具身智能模型的发展,不同来源的数据将会进一步整合到统一的训练框架之中,共同提升机器人的智能度。随着数据量的持续积累,模型得以逐渐从模仿特定动作的阶段进化到理解动作语义的更高层次。遥操作所占的比例也将随之逐步降低,而机器人自主决策的比例则会相应提升。而这一切演进过程的起点正是当下对每一帧遥操作数据的系统性积累。
对于VR/MR厂商而言,具身智能可以提供消费市场之外的新需求来源;对于机器人产业而言,XR则为数据采集、人机协同以及远程控制提供了成熟的技术基础。
从实际的市场反馈来看,机器人产业有力拉动了XR设备在B端的采购工作,而这些设备所产出的数据则反过来对机器人模型的迭代过程进行了有效反哺,进而进一步扩大了对XR设备的需求,使得XR硬件出货与机器人数据需求之间形成了正向循环。
在机器人能够真正达成自主学习的目标之前,人类所积累的经验依然属于最为关键的训练资源之一,而XR则正在发挥出连接人类操作者与机器人系统的桥梁作用。这也许并非XR产业在最初阶段所设想的主要发展路径,但却有可能转变为其下一阶段所具备的重要价值所在。
2026年,消费级VR/MR厂商密集布局具身智能领域
来源:2026年, 消费级VR/MR厂商扎堆具身智能 | OFweek机器人网