具身智能的三个幻觉与一个现实

2026年05月07日 17:53
本文共计2888个字,预计阅读时长10分钟。
来源/机器人大讲堂 责编/爱力方

“落地”是否在被具身智能企业滥用?

你最近有没有这种感觉:具身智能行业每隔几天就有新消息,又有公司融了几亿、又有公司进了工厂、某个机器人又上了某某节目,热闹非凡。

但真正在这个行业里做事情的人,心里其实在打鼓:Demo越来越多,融资越来越容易,真正跑通的商业模式越来越远。

Image

这不是偶然。这是一种系统性的认知偏差,而且是有能力的公司才会犯的那种。那么为什么行业里最聪明的公司,依然在重复最基础的错误?

这些问题,在行业里很少有人愿意公开讲。它们指向一个核心判断:具身智能行业正在集体踩坑,踩的是三个理所当然的幻觉。

PART 01

三个幻觉是什么?

幻觉一:硬件做好了,渠道自然就通了。这个逻辑在汽车行业成立。好的汽车,用户本来就需要。卖出去,持续使用,渠道就建立起来了。

但具身智能不一样。一台没有智能能力的机器人,放在家庭里,大概率的命运是,新鲜两周,然后放在角落里积灰。用户不会因为它是一台机器人就持续打开它。这和AR/VR眼镜没什么区别,卖出去,不等于它成为了一个高频、稳定、可增长的分发渠道。

更直接的问题是,卖出去,也不等于它真的在创造价值。如果一台具身智能设备买回来,每天都在调试,三周才能用上,这个产品本质上还没有Ready。

而当前很多具身智能公司的硬件,在真实场景里的稳定性远没有达到这个标准。

图片

幻觉二:把大模型塞进去,问题就解决了。行业里有一个流行的叙事,只要把Foundation Model做足够大、把预训练数据做到足够多,具身智能就能自然突破。

这个叙事有两个问题。第一,大模型的能力是怎么来的?很多人以为靠的是预训练。但实际上,这几年大语言模型的能力飞跃,来自预训练和后训练之间的循环迭代,而不是把预训练做到底自然产生的。一个真正好用的coding model,是在专有数据上后训练出来的;通用模型在这个具体任务上,永远打不过专用模型。

具身智能领域,现在几乎所有人都在讲预训练。讲后训练的人,少之又少。原因很简单,后训练需要真实场景里的持续数据回流,这比在实验室里跑数据难一百倍。

第二,具身智能不是纯软件。它的增长瓶颈不只来自模型能力,也来自物理本体的可靠性、场景适配的工程能力、以及整个部署渠道的建设。这些是模型公司解决不了的问题。

幻觉三:进了场景,就等于建立了飞轮。具身智能行业目前最喜欢说的一个词是飞轮——进场景、采数据、优化模型、再进更多场景。听起来完美。

但这个飞轮有一个前提,那就是机器人必须在真实场景里持续产生价值。否则,飞轮根本转不起来。

图片

真实的情况是什么?很多公司确实进了工厂、进了一些场景。但背后的真实数据是,有些合作只维持了几个月,就因为达不到ROI要求被客户请了出去。行业里有一个心照不宣的秘密:有些出货量,是靠PR效应换来的,不是靠产品真正创造了价值。

真正可持续的飞轮,需要的是一整套部署能力和基础设施,场景评估、任务边界定义、数据采集与回流、现场调试、远程诊断、持续更新、可靠性维护。这个链条上的每一个环节,都需要大量工程能力的积累,不是几个炫酷的demo能解决的。

PART 02

一个被回避的问题:什么才叫落地?

回到开篇的问题,行业里对落地这个词的使用已经极度随意。只要进了场景、产生了收入、有人在用,都可以声称自己落地了。

但如果仔细追问:每天都在用吗?ROI能算过来吗?客户明年还愿意续约吗?大多数回答就没那么确定了。

一家具身智能公司的创始人说了一句很直接的话:任何demo,如果不能在真实场景里被看到每天持续给客户创造实际价值,我们都不认为它是真正落地。

这话听着有点绝对。但细想一下,确实击中了行业的软肋。一次性收入不是商业模式。如果卖一台设备,赚的是新鲜感的钱,那这笔收入和炒股赚的没什么区别,而且过程累得多。

很多公司选择进工厂,作为一个更容易标准化的方向。逻辑是对的。但难度被低估了。

为什么工业场景比想象中难十倍?工业制造对可靠性、稳定性和速度的要求,是极致严苛的。具身智能和传统工业机械臂最大的区别,应该是有大脑,能做需要判断力的工作,而不是完全固定流程的操作。但问题是:这些需要判断力的工作,往往同时对效率有极高要求。而当前的具身智能,在泛化能力和执行速度之间,还没有找到平衡点。

图片

剩下的那批需要人的工作,恰恰是工业里最难自动化的部分。它们需要判断力,同时对效率要求极高,而且每一个工厂的SOP都不一样。这种复杂程度,不是塞一个大模型进去就能解决的。

所以那些进了工厂、成百上千台出货的数字,需要认真追问,这些机器人,每天真正在干活的时间有多长?它们是客户离不开的生产工具,还是客户愿意保留的试验品?

PART 03

Scaling Law在具身智能为什么不成立

大模型有一个被反复验证的Scaling Law:数据越多、模型越大,能力越强。

这个定律成立,有一个关键前提:预训练和后训练,共享一个相对统一的衡量指标,比如text perplexity。

具身智能没有这个前提。下游任务对速度、成品质量、可靠性都有明确要求,但这些指标在今天的数据集里几乎没有统一的衡量标准。没有统一的度量衡,数据越多越好就是一个无法验证的命题。

这也是为什么行业里用数据这个buzzword忽悠了很多人。大家觉得不管什么数据,只要采集了就有用。但真正做过模型的人知道:Off-purpose data的清洗和适配成本,往往大于它带来的优势。玩具和陪伴场景采集的数据,和真正干活场景需要的数据,是完全不同的两件事。

具身智能行业现在最赚钱的公司是哪类?不是你想的那批人,不是那些Demo最炫酷的,也不是那些融了最多钱的。

是卖铲子的。硬件供应商、数据采集服务商、算力提供商。在任何新兴行业早期,最先赚走钱的往往就是这些基础设施供应商。因为行业高度不确定,很多人买东西不是基于product,而是基于delivery:只要交付了,就给钱。

图片

这个现象本身不一定是坏事。但它说明了一个问题,行业还没有形成对product的真正要求。大家都在买交付,没有人在买价值。

而那些真正在做具身智能整机的公司,花了大价钱买铲子,寄希望于有一天自己的产品能真正创造价值。但铲子公司不会告诉行业:这个铲子用起来到底好不好,能不能真的解决问题。

PART 04

写在最后:少一些叙事,多一些真问题

具身智能行业正在经历一个危险的时刻。因为融入了人形机器人等更多前沿概念,资本在追捧,估值在飙涨,但真正跑通的商业闭环少之又少。

泡沫不是问题本身。泡沫是预期和现实之间的差距。差距大到一定程度,资本会重新定价,行业会出清。

但出清之后,真正留下来的,一定是那些在真实场景里持续创造价值的公司。它们可能没有炫酷的Demo,没有动辄百亿的估值,但它们的客户离不开它们。

这才是具身智能公司应该追求的方向。不是市值,是不可替代性。

行业需要更多愿意说真话的公司。具身智能行业能有多少参考价值,取决于有多少人愿意认真对待里面的问题,而不是急着吹捧与反驳。

如果你读完这篇文章,想的是这些我都知道了,那我建议你去问自己一个问题:你真正进场景的那些项目,有多少是客户主动续约的?如果找到,那你就能活下来。

来源:具身智能的三个幻觉与一个现实 | 机器人大讲堂

声明:本文来自机器人大讲堂,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/