机器人全身协同控制系统实现精细操作
机器人学会撕茶包了。
这一过程并非分步进行,即先移动至目标位置并稳定站立,然后才由手部执行具体动作;相反,它是在同一套统一的策略框架内,将行走移动、姿态调整、躯干协同以及手部的精细操作等多个环节进行综合规划与无缝整合。
该模型成功实现了移动以及精细操作的协同执行。
今天 ,Current Robotics发布全身灵巧操作模型Curr-0。
借助Single Policy,Curr-0能够在同一个模型之中耦合移动、全身姿态的协调以及手部的精细操作,从而实现全程自主执行。这也体现了Current Robotics在机器人数据基础设施与具身智能全栈训练系统方面所取得的最新成果。

在Curr-0的技术演示中,机器人成功执行了一系列任务,例如撕开茶包、点燃香烛、盖章、拾起揉皱的纸团,乃至抱着玩具穿过门口、蹲下并将其放入篮子。这些动作虽然在表面上看似简单,但其技术难点在于要求机器人全身与手部必须高度协同地参与其中。因为机器人的站姿会直接决定其抓取的可行性,躯干的姿态会影响其动作的可达范围,而身体重心则会直接影响其施加力量的方式与稳定性。
手的问题,其实不在手
人类弯腰捡东西时,双脚、膝盖、腰部、肩膀与手指会同时进行调整配合。这构成一个完整的协调动作,并非五个独立动作。
但机器人过去通常是这样的:
走过去 → 停下 → 操作 → 再移动
这套预设的逻辑在工厂的流水线上尚能运作,但一旦置身于真实的、非结构化的世界当中,便行不通了。这是因为抓取动作的稳定性在很大程度上取决于机器人的站姿,而其能否真正够到目标物,同样需要考量身体各部位如何协同配合。因此,仅仅拥有灵巧的手部是不足以保障任务成功的,更为关键的是机器人的整个身体能否与手部动作实现协调统一。
从机器人的角度而言,移动与操作从来都不是两个相互独立的问题,而应当被视为一个统一的整体性问题。Curr-0所要解决的,恰恰就是这种被称为全身灵巧操作(Loco-Dexterous Manipulation)的能力。
一个模型掌控全身
Curr-0的实现关键在于,其核心在于,并非将移动控制、全身姿态协调以及手部精细操作这三个方面视为三个独立的模块来进行处理,而是将它们作为一个统一的端到端问题来开展训练工作。
机器人不依赖于预先的完全规划与决策,而是在运动执行过程中,让其全身关节与机械手进行持续的协调与同步调整。整个系统基于单一的端到端模型构建,各部分共享同一组模型权重,从而能够实现全程的自主运行与控制。
同一策略控制器在同一框架内对身体移动、姿态稳定与精细操作进行统一协调,从而使机器人获得了全身各系统协同以完成复杂任务的能力。
人形全身精细操作数据从哪里来
Curr-0依赖于21,000小时的人类真实行为数据来完成训练工作,其中涵盖了2,800小时的全身示教数据。
这些数据源自于一套由Current Robotics自主研发的全身外骨骼数据采集系统,该系统名为HumanEx。
与直接操控机器人的遥操作方案不同,HumanEx通过让人类穿戴外骨骼设备,使他们能够在真实场景中自然完成任务。

由于无需对机器人本体进行直接控制,HumanEx可以被部署于工厂、实验室以及办公室等真实场景当中,来开展数据采集工作。系统会同步记录全身姿态、关节运动、手部动作、本体感知、肌电信号以及环境交互方面的数据,并将其转化为可供机器人学习的训练素材。
这类数据不仅记录了手部如何运动,更为核心的是捕捉并记录了全身如何协同配合以完成任务:双脚如何实现稳定站立,躯干如何进行姿态调整,身体如何协调施力,以及手指如何在接触的瞬间完成精细的控制动作。
Current Robotics明确指出,训练过程所产生的数据并非仅仅是训练模型过程中的副产品,而应当被视为驱动具身智能系统的核心基础设施。
HumanEx将数据规模的增长路径从依赖于“机器人部署小时数”成功转换到依赖于“人类任务小时数”。这使得数据飞轮不再受限于机器人的实际部署数量,而是能够随着真实世界中人类任务数据的持续累积而不断扩展。
下一步:多物理模态交互世界模型
Current Robotics认为,仅依靠真实机器人的训练不足以支撑大规模的迭代优化工作。其原因在于物理世界所具备的属性决定了其无法实现规模化运作。具体而言,在物理世界中对一台机器人进行测试,不仅会消耗硬件资源、能源以及人力,而且每次实验失败后都无法进行回滚操作,场景也无法根据需求进行重置。
因此,该团队正在构建一个能够覆盖视觉、本体感知与力觉等多种物理信号的多模态交互世界模型。他们期望借助这一模型,把相关的评测、后训练以及部署验证等关键环节,从对真实硬件的依赖中解放出来,迁移到一个可扩展的数字环境中进行。
基于上述的理论与数据基础,Current Robotics进一步提出并构建了Human-in-the-World-Model框架。该框架的核心思路在于,允许人类直接介入到世界模型内部,对模型生成的策略方案进行修正与调整。所修正的策略方案能够立即被用于模型的后续训练,以此来减少模型后训练阶段对于真实物理机器人部署以及人工干预环节的依赖。
从数据到部署,全栈闭合
从HumanEx对真实人类数据进行采集,到Curr-0所开展的端到端训练,再延伸至世界模型的评测环节,直至Human-in-the-World-Model所执行的后训练与部署工作,数据、模型、评测以及部署这四个关键环节得以在同一套体系内实现持续的迭代与演进。
由此可见,Current Robotics的真正目标并非实现单点突破,而是达成全栈闭合。
随着人类行为数据持续积累的过程,模型的整体能力得以持续提升与优化,而不必受限于机器人Fleet规模的扩张。
随着行业从单纯追求机器人对世界的感知能力,逐步转向致力于通过机器人主动改变世界,全身灵巧操作技术已然成为构建下一代人形机器人不可或缺的核心能力。
从数据采集到模型训练,再到世界模型构建以及部署验证环节,Current Robotics正致力于搭建一套完整的具身智能基础设施体系,将上述各关键环节紧密串联在一起。
而Curr-0,则是Current Robotics全栈技术路线在发展过程中所取得的一次阶段性成果展示。
来源:一个模型控制手脚腰身!机器人终于学会全身协同干精细活了 | 具身研习社