得场景者得具身智能:当数据成为物理AI的“矿权”,物联网的价值必将重估

2026年06月10日 16:49
本文共计4375个字,预计阅读时长15分钟。
来源/OFweek机器人网 责编/PixelHunter 像素猎人

作者:彭昭(智次方创始人、云和资本联合创始合伙人)物女皇:经验较数据更为稀缺 物联网智库原创

上一篇《把大象塞进冰箱:“液态AI”背后藏着AIoT的第一性原理》当中,端侧智能被比作一台冰箱,同时也留下了一个悬念:这台冰箱始终面临着两个硬约束,其中一个是算力与能耗,对应的是冰箱的“电力”;另一个则是数据,对应的是冰箱的“食材”。前文已经讨论了液态AI如何让冰箱“省电”,也就是依照需求来消耗能量,今天则继续讨论那个更为棘手的问题:食材究竟从哪里来?

在此前的文章《当台积电把人形机器人写进财报:芯片侧的“明牌”与数据侧的“暗战”》中,曾经给出过一个判断:台积电借助三十多年时间在芯片端构筑起了护城河,大模型公司则用三年时间在模型端挖出了护城河,而下一道天堑,极有可能会建立在数据端。这一篇文章,便借助“冰箱”这一比喻,进一步对这场数据暗战背后的底层逻辑进行拆解。

最近国内有两幕场景,值得关注。

一边,京东宣布将依托零售、物流等海量真实业务场景,着手构建具身智能数据采集中心。其甚至计划动员六十万人佩戴自研的穿戴设备JoyEgoCam,对做家务、劳作的第一人称画面进行“即戴即采”,目标是在两年时间内积累下一千万小时数据。

另一边,以优必选Walker S2为代表的工业人形机器人,已经开始成批进入新能源车企、3C产线以及物流仓库,并把作业工种进一步收敛到搬运、分拣与质检等环节。从比亚迪、富士康到顺丰,这份“进厂打工”的企业名单也在持续拉长。

一家电商巨头动员数十万人去记录真实生活场景,一批机器人进入工厂流水线,在持续作业的同时积累数据。 当下最敏锐的资本,正在借助最朴素的方式,去获取一种无法直接购买的资源。

为什么会买不到?因为互联网这座“超市”里所摆满的文字、图片以及视频,从本质上来看,都只是人类对世界所进行的“旁观记录”。而那些需要在物理世界里采取行动的机器人,真正需要的则是第一人称的“交互反馈”,例如推门时所感受到的阻力、关节所处的角度,以及物理世界所给出的实时回应。这类数据在超市里并不售卖,只能依靠自己下地去种,再亲手去摘。

这篇文章将重点围绕三个核心议题展开讨论:具身智能数据为何会呈现出根本性的稀缺,既有物联网体系为何会成为化解这一痛点的最佳数据来源,以及在这条正在被重塑的价值链当中,谁将真正掌握主导权。

见底的是经验,而非数据

如果笼统地把行业瓶颈归结为“缺数据”,那么这其实是一种误读。互联网上的数据几乎无穷无尽,而真正趋于见底的,其实是另一种更为关键的东西:经验。

这或许恰恰是当前产业界存在的误区之一,即把具身数据直接等同于视频数据。

互联网视频本质上属于“观察者”视角下的记录,而具身智能真正需要的,则是来自“第一人称”视角的多模态行动数据。

文本大模型所汲取的是“知识”,而具身大模型真正需要的则是“经验”;至于真正意义上的经验,必然包含着在物理世界当中不断试错并持续接受纠正的过程。比如说,如果要让机器人学会擦桌子,那么就必须在真实发生的物理交互过程当中,以极高的时间同步率,把视觉、力觉、关节位置以及电机指令等多维传感轨迹完整记录下来。而这类数据,在互联网上根本不存在现成可用的来源。

这一区分,实际上把问题的性质从“数量不足”转变成了“类型失配”,而类型层面的缺口,本质上并不是依靠资金投入就可以填平的。2025年,超过60亿美元的狂热资本正在涌入人形机器人赛道,但其中最根本的瓶颈却几乎没有发生变化;更多的资金可以购得顶级硬件、吸引天才工程师,却依然无法凭空变出原本就不存在的训练数据。

此前曾经算过一笔账,文本大模型的训练语料是按照“百亿小时”来计量的,而当前整个行业当中高质量的具身智能数据存量,大约却只有50万小时。从50万到百亿之间,横亘着一道两万倍的鸿沟。这里还存在着一个鲜明反差:全球正在运行的工业机器人达到466.4万台(截至2024年),但与如此庞大的硬件存量相比,公开可供机器人学习的高质量真实交互数据,仍然主要停留在百万级轨迹量级。以Open X-Embodiment为例,这一具有代表性的开源机器人数据合集包含100万+真实机器人轨迹,已经对多种机器人形态以及任务数据进行了聚合;但相较于数百万台正在真实工厂、仓库以及服务场景当中运行的机器人,其可训练数据规模依然显得十分稀薄。

更为关键的是,这道鸿沟不仅体现于“数量”层面,更直接体现于“维度”层面。

机器人的数据感知维度至少会在六维以上,其中涵盖了视觉、听觉、力觉、触觉以及本体感知等多个方面。然而,当前产业界九成左右的精力,依然主要停留在RGB视觉这一两个维度之上。巨头们费尽心思所采集的所谓“机器人数据”,在感知维度方面充其量也只解决了十分之一的问题;至于其余的力觉、触觉以及本体感受,直到今天仍然没有现成的规模化采集路径。症结从来都不在于数据“多不多”,而在于数据“对不对”。

沿着这一判断继续向下展开来看:既然所谓“经验数据”只能依靠亲身作用于物理世界的实体来加以生产,那么在此时此刻,究竟是哪一类事物已经大规模地嵌入到物理世界当中,并且正在持续不断地进行感知与动作?

答案所指向的,是一个长期以来都被低估了的关键存在:物联网。

油田与炼厂:物联网的价值终将被重新估量

工业现场中的传感器、街头部署的摄像头、腕部佩戴的可穿戴设备、道路上的智能汽车,以及产线之上的机械臂……这些共同构成的庞大“存量物联网”,是当前唯一一张已经大规模铺设进物理世界,并且仍在持续开展感知的网络。

此前在讨论数据采集时,行业的目光往往更多聚焦于那些专门为了采集而建设的“数据工厂”以及“训练场”;但实际上,还存在着一座规模更为庞大、却长期未被作为数据资产来加以看待的矿藏,也就是那些早已出于其他目的完成部署、并且在此刻仍然日夜运转的存量设备。

它们从一开始就是经验数据的采集通道。这也意味着,物联网的价值坐标或许需要被重新标定:它必须从过去以“连接与降本”为主的成本中心,重新估值为能够给具身智能持续提供数据燃料的利润中心。

 

但在这里,仍需先回应一个关键质疑:既然工厂之中早已积累了大量传感器数据,那么机器人为什么依然会处于“吃不饱”的状态?

答案其实很残酷:绝大多数存量数据原本就并不达标,它们彼此之间相互孤立、缺乏必要标注、模态之间难以同步,更没有同动作指令形成有效配对。粗略来看,当前行业数据的“良品率”大致只有约三成。成本的大头并不在采集设备本身,而在于标注、验证以及技能的抽象化。谁能够把良品率从三成提升到七成,谁就会握有两到三倍的成本优势。

因此,油田即便遍布各处,炼厂却依旧十分稀缺。真正处于核心位置的,是那座能够把“传感器废气”进一步提炼成“可训练燃料”的炼厂。开采仅仅只是第一步,原油如果无法炼制成燃料,就无法真正烧进任何一台机器。

也许有些人会提出反驳:世界模型完全可以依赖于仿真环境来合成数据,物理采集不过只是阶段性的权宜之计。这条赛道的热度确实毋庸置疑,然而从仿真走向现实的那道鸿沟,本质上是物理规律层面的鸿沟,而并非单纯的工程问题。

电网中一度电所对应的微小电压波动、车间地面摩擦系数之间的细微差异,以及一块皮革表面所呈现出的复杂纹理,都足以使那些在仿真环境中运行得近乎完美的算法,在进入现实之后瞬间失效。合成数据如果想要具备可信性,其前提就在于必须有真实数据对其进行锚定与校准。因此,借助物联网所采集到的真实经验,永远都不会被合成数据所替代;恰恰相反,它会进一步沉淀为整个合成数据范式之所以能够成立的“物理底座”。

与此同时,也需要承认,当下大量存量物联网设备所采集的,依然是温度、电流以及振动这类“低维遥测数据”,而这并不是机器人最迫切需要的“高维接触数据”。真正能够构成具身智能底座的,是那些正在快速铺开的高保真、多模态边缘网络,以及高清摄像头、高精度可穿戴设备、车载多维传感,还有被全面深度感知化的生产线。

而这,恰好与上一篇专栏的论述构成了内在呼应:边缘端在逐步形成更为节能的“大脑”的同时,也在持续生成更为敏锐、更加丰富的“感官”。冰箱正在变得更加节能,而孕育智能的物理土壤,也正在变得愈加丰沃。

价值链的主导方向正在发生反转:谁掌握真实场景,谁就更有可能掌握具身智能

当“燃料”的来源被真正看清之后,价值最终会落在何处,也就随之变得清晰起来。若把具身智能的资本版图进一步拆解来看:最上层是机器人本体厂商,早已是一片红海;中间层则是数据采集设备以及平台,蓝海格局才刚刚显现;而最底层所对应的,是由国家队主导的数据要素基础设施,并且越往下,其根系也就扎得越深。

而驱动这一具身智能金字塔持续运转的底层逻辑,在于数据飞轮:先在真实世界当中部署设备,对交互数据进行采集,用以喂养并强化模型,继而推动更广泛、更深层次的部署。

这一飞轮所指向的,其实是一个颇具反直觉意味的结论:它会天然地偏向那些早已掌握物理场景的“存量玩家”,而不是单纯专注于本体制造的创业公司。

 

谁能够持续掌握源源不断产出数据的真实场景,谁就更有可能把握住最终胜局;至于机器人本体究竟造得是否足够出色,反而会退居到次要位置。就连老牌工业机器人厂商也已经直言,自身所服务的制造业客户群能够直接接触真实工件以及真实生产环境,而这种“充满物理质感”的数据,恰恰是那些纯软件出身的具身智能开发者最为匮乏的关键资产。

数据飞轮的瓶颈从来都不在传感器本身,而在于数据的确权、流通以及标准化,而这一系列关键环节,正在被作为国家级工程加以强力推进。今年年初,全国首单具身智能数据集已经在江苏省数据交易所完成场内交易,成功实现了该品类在数交所交易层面的“零的突破”;与此同时,国家数据局也已明确表示,今年我国将推出三十余项数据领域国家标准,并且会在智能体、具身智能等前沿方向提前开展布局。

未来,具身智能时代的胜负手,未必会落在能造出多么漂亮的机器人,或训练出多么惊艳的模型之上,而更有可能落在是否能够率先建成那一套制度与工程底座,并把庞大的存量物理世界真正转化为可交易的数据燃料。

写在最后

近期的两篇文章正在逐步形成一个系列:上一篇所回应的是“按需耗能”的问题,而这一篇所要进一步解决的,则是“持续供粮”的问题。具身智能真正意义上的护城河,既不在于机器人本体,也不在于智能大脑,而在于那片能够持续自我造血的“物理底座”。当这些设备进一步连接成网之后,数据以及价值究竟应当依照何种规则来交换,又应由谁来制定规矩,这将成为接下来需要回答的问题。

大象若要真正走进物理世界,所面对的难题从来都不只是算力与能耗;真正构成下一轮更硬考题的,是数据、规则以及价值分配。

原文标题:得场景者得具身智能:当数据成为物理AI的“矿权”,物联网的价值终将被重新估量

来源:得场景者得具身智能 :当数据成了物理AI的"矿权",物联网的价值必将重估 | OFweek机器人网

声明:本文来自OFweek机器人网,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/