过去一年,具身智能行业形成了一个基本共识:没有百万小时级别的大规模真机数据,就很难训练出真正能进入物理世界的机器人模型。
但共识之后,分歧才真正开始。
今天行业里有很多采集路线:真机采集、遥操作、真实生产部署等等。不同路线背后,对应的是不同的技术路径、成本结构和商业想象。
6 月 5 日,原力灵机宣布通过股权并购方式,完成与物流机器人公司 Atomix 的合并,并完成新一轮融资。国内顶尖大模型公司智谱、阶跃星辰、商汤、阿里集体押注,华勤、上汽恒旭等核心产业方同步加持。
这不是一次简单的公司并购,而是具身智能数据采集路线的一次明确下注:把模型能力接入真实业务流,让机器人在真实产线中形成数据飞轮。
成立一年多来,原力灵机已经搭建了模型、框架、评测、场景在内的闭环,其具身原生大模型 DM0 在真机评测中位列第一,并在物流领域积累了大量产业实践。Atomix 则拥有日均出货 60 万件以上、覆盖全球 20 多个国家、服务近百个品牌的业务网络。
这也是并购真正值得关注的地方:对具身智能来说,高质量真机数据往往不是在实验室里专门“采”出来的,而是在真实业务压力下“跑”出来的。订单波动、货品长尾、遮挡误抓、异常兜底、系统对接、持续运行,真实世界的复杂性,正是训练机器人泛化能力最稀缺的燃料。
真机数据成共识,但采集路线正在分化
具身智能走到今天,行业已经形成一个基本判断:机器人大脑的能力上限,很大程度取决于投喂过多少真实世界的数据。
共识之后,真正的分歧是:数据到底怎么来?
第一条路线是真机采集。
真机采集就是让机器人在真实场景中执行任务,并记录全过程数据。例如,机器人在仓库中抓取商品、搬运料箱、分拣包裹。
国内真机采集路线的一些代表公司提出多样化真机采集理念,反对过度依赖“干净数据”,主张开放式、目标驱动的多样化数据采集,让机器人从更杂乱、更连续、更接近现实生活的经验中学习。
但真机采集路线也有短板,比如冷启动难、失败成本高、数据噪声大等。如果机器人一开始能力不够,不能直接大规模上真实场景。
第二条路线是遥操采集。
遥操采集就是人通过设备远程控制机器人,让机器人模仿人的动作完成任务。常见方式包括:VR手柄、主从机械臂、外骨骼手套、动作捕捉设备、力反馈设备等。
遥操的优势在于质量可控、适合冷启动,尤其适合采集精细操作、双臂协同、多步骤任务的数据。机器人还不会做的时候,先由人带着它做一遍,这是最直接的训练方式。
但遥操采集也有天然瓶颈。它需要操作员、设备、场地和机器人维护,人一天能操作的时长有限。如果目标是百万小时级别的真机数据,就很难只靠人力堆出来。而且,遥操数据本质上教机器“人是怎么做的”,但未必等同于机器人的最优做法。
第三条路线,是真实业务部署。
这条路线最大的不同在于,它不是先围绕训练来设计采集任务,而是先让机器人进入真实业务场景,在持续运行过程中自然产生数据。
原力灵机与 Atomix 的结合,可以放在这条路线下观察。Atomix面向物流仓储场景提供 AI 原生柔性仓储解决方案,通过多类型机器人协同,打通“存—搬—拣”完整链路。根据公开资料,Atomix已完成 500 多个项目交付,服务 60 多个品牌客户,包括优衣库、蜜雪冰城、宁德时代等头部企业。其托盘四向车业务也已在大规模项目中形成工程交付经验,单项目最高调度规模达到 600 多台机器人。
这不仅意味着业务规模。放到具身智能的数据维度看,它更意味着一个能够持续产生真实任务、真实反馈的业务入口。
高质量真机数据,不是采出来的,是从业务中跑出来的
在具身智能里,高质量数据不是专门为训练采出来的,而是在真实履约压力下跑出来的。这正是真实业务部署路线与其他路线的真正分野。
过去行业谈真机数据,更多关注怎么采到更多。于是出现了遥操作、低成本数据工厂、多样化采集等路线。它们解决的是数据供给问题。
但真实业务路线问的是另一个问题:机器人如何先在业务中真正跑起来,并在跑的过程中自然产生数据?这背后有三层逻辑。
1. picking 是高频、可验证、可闭环的原子任务入口
物流场景之所以适合作为具身智能的早期入口,因为它有大量高频、重复、结果明确的操作任务。其中最典型的就是 picking(抓取)。
picking包含一整套连续能力:机器人要先识别物体,判断位置和姿态,再完成抓取、移动、放置,并在抓错、掉落、遮挡、空间受限时进行调整和恢复。picking覆盖了具身智能最核心的训练单元:视觉理解、空间定位、末端控制、物体交互、失败恢复和连续执行。
此外,picking还有几个非常适合训练模型的特点:高频发生、结果明确可验证,能向其他任务迁移。
根据公开资料,Atomix拥有中国具身智能赛道最大、最真实的物流 picking 数据源。对于原力灵机,这类数据更接近模型持续迭代所需要的“真实燃料”。
2. 真实业务数据不只是更多,而是带着结果反馈和恢复路径
真实产线里的数据更复杂,也更有价值。它不仅记录机器人做对了什么,也记录机器人怎么出错、谁来接管、系统如何兜底、任务如何恢复、最终有没有完成履约。
换句话说,真实业务数据里天然包含三类训练价值:
成功路径,告诉模型怎么完成任务;
失败样本,告诉模型哪里容易出问题;
恢复过程,告诉模型出错后如何继续。
3. 海量订单倒逼机器人从单点能力走向系统能力
在实验室里,机器人完成一次抓取、一次分拣、一次搬运,就可以成为 Demo。但在真实业务里,这远远不够。
只有真实订单流,才能持续产生真实任务;只有持续任务,才有持续数据;只有持续数据,模型才有可能形成持续迭代。这也是数据工厂路线和真实业务路线的根本差异。
原力灵机创始人兼 CEO 唐文斌提到,具身大模型的 Scaling 必须从人工采集走向产业场景。这个说法背后,其实对应的正是行业正在发生的变化:具身智能的数据扩展,不能长期只依赖实验室采集和遥操作堆人力,最终必须进入真实产业流程。
当然,这并不意味着这条路没有挑战。
物流场景高频、刚需、可验证,确实适合作为具身智能落地的早期入口。但从物流 picking 到更开放的家庭、商超、养老、服务机器人场景,中间仍然隔着任务复杂度、环境开放度、成本结构和安全责任的多重挑战。
只不过它代表了一种更现实的产业路径和发展方向:先在高频真实场景里跑出数据闭环,再把模型能力向更多任务和场景外溢。
具身智能,拼的是模型与场景的深度融合
中国信通院在《具身智能发展报告2025》中指出,具身智能是一种全新的技术范式,强调“数据驱动”的人工智能与“场景驱动”的机器人的深度融合。场景 + 模型深度融合,才是具身智能真正的闭环。
从产业来看,原力灵机并购Atomix也是一次闭环能力的重组:
原力灵机提供的是模型与基础设施能力:
DM0是全球首个具身原生大模型,仅有 2.4B 参数量,却在 RoboChallenge 真机评测中位居全球第一。它的优势不只是模型成绩,而在于面向真实物理世界设计:通过多源数据预训练、多任务跨机型预训练,以及复杂任务中的精细操作能力,让模型从不同数据、不同任务、不同机器人本体中学习更通用的物理规律。
Dexbotic 是面向具身智能开发的开源框架,支持多源数据混合训练、跨机型适配、模仿学习与强化学习衔接。公开资料显示,它已经服务清华、北大、普林斯顿、帝国理工等高校,以及腾讯、北京人形等企业,聚集了上千位开发者。
RoboChallenge 是真机评测平台,它是原力灵机与 Hugging Face 联合发起,吸引了近 20 家具身智能企业联合运营,累计服务全球超过 8 万次真机测试。
Atomix 带来的,则是物流场景、项目交付能力和持续订单流,解决“机器人在哪里跑、如何持续跑”。
这种模型与场景的结合,也会进一步体现在即将发布的物流机器人系统“飞拉达”上。据透露,“飞拉达”将面向多类型机器人混合作业场景,突出 DM0 跨机型应用、三级分拣和多类型机器人协同作业。
随着并购完成,原力灵机的组织形态也进一步全球化。其正在形成“北京 + 全球五地”的架构:北京承担模型研发与技术核心,香港作为全球总部,新加坡承接 Atomix 全球商业总部并辐射东南亚市场,日本与韩国子公司贴近 Fast Retailing 等关键客户,美国办公室也计划于 2026 年 6 月启动。
即将到来的 7 月,原力灵机还将发布下一代 DM 模型、通用机器人本体和下一代应用基础设施。与此同时,公司也启动“百人全球招募计划”,开放具身智能核心算法、机器人学习、大模型训练、工程落地等核心岗位,以匹配全球客户和市场需求。
结语
2026 年被不少业内人士称为“具身数据元年”。
当百万级规模真机数据成为共识,具身智能比拼的关键是数据从哪里来、以什么成本、能不能持续。从长期视角看,从人工采集走向产业场景是真机数据的必经之路。
因为具身赛道未来的赢家,不会只是单点模型最强的公司,而是同时拥有真实场景入口、规模化数据工程能力、具身原生模型能力和商业闭环能力的玩家。
END本文为「智能进化论」原创作品,欢迎关注。
智能进化论专注云计算和智能科技领域的深度评论。希望用通俗易懂的文字解读科技趋势,洞察技术驱动的商业变革。
原文标题 : 原力灵机并购Atomix:让机器人在真实业务中长出数据飞轮