千亿热钱砸不出具身智能的答案:Demo困在展厅,工厂等不来订单
作者 | 孟昭野(杭州)
在维也纳的ICRA 2026国际机器人与自动化大会展馆内,十几家中国科技公司的机器人产品正现场进行一系列功能演示,包括叠放衣物、倾倒液体以及拧紧螺丝等精细操作,其高度的实用性与稳定性吸引了大量专业观众驻足围观,展台周围因此聚集了众多人群。
有人正在举着手机拍摄机器人灵巧手精确捏起一枚螺丝钉的画面,旁边一位欧洲工程师则向同行低声询问:“这一操作是否完全由机器人自主完成?”
关于这个问题的答案,至今无人敢百分之百地肯定。
在过去的半年时间里,有高达460亿人民币的资本涌入了具身智能这一热门赛道。这笔资金的规模相当可观,倘若将其全部兑换成面值一百元的纸币并首尾相连,其总长度足以从北京铺设到上海,再完整地往返一趟。
然而,它所购得的,究竟会是一个即将步入爆发期的万亿规模产业,还是一系列精心制作的Demo演示视频与融资通稿,这恰恰是所有人内心真正关切的核心疑虑所在。
一、达闼的教训近在眼前
根据IT桔子所发布的统计数据,在2026年上半年期间,国内具身智能以及机器人领域累计发生了288起融资事件,涉及的企业数量达到了226家,所披露的融资总额超过了460亿元。
将统计周期扩展至2025年7月至2026年6月这一时间段,所呈现的数据则更为惊人,累计发生了503起融资事件,涉及金额超过960亿元。
钱在变多,拿到钱的人却在变少。
在上半年,前五家公司千寻智能、曦望Sunrise、星海图、自变量机器人以及极佳视界共同完成了约171亿元的融资,这一数额占据了全行业融资总额的37%。
在2026年上半年的融资分布中,前20家公司通过其市场地位,获取了约七成的份额(约330亿元),而剩余的200多家公司则只能共同分配不足三成的资金(约124亿元)。以千寻智能为例,该公司一家便融得45亿元,并在4个月内完成了4轮融资。
更值得深入探究的是,资金究竟来源于哪些投资主体。传统风险投资机构(VC)在这一领域依然保持活跃,例如高瓴资本出手13次,红杉资本则进行了10次投资。
但值得关注的是,在十亿元人民币及以上规模的大额融资领域,主导力量已经发生了显著转变。诸如百度、字节跳动、小米、美团、上汽集团、汇川技术以及各地方政府背景的投资平台等产业资本与国资主体,构成了新的投资方阵营。将产业资本与国有资本的份额合并计算,其总体占比已超过百分之四十。
百度的投资路径较为明确,其同时参与了智平方B轮10亿元融资以及北京人形机器人创新中心A轮7亿元融资;美团与滴滴则完成了对地瓜机器人的投资;上汽方面在半年时间内完成了对4家具身智能公司的投资布局。
在数亿元及以上的大型融资交易中,国资扮演了主导角色,参与率高达42%,其介入方式更为直接。地方政府的行动遵循着一套清晰的“投资-落地-市场”逻辑:首先以资金进行投资,随后要求企业在当地建设生产基地,并同步将本地的工厂开放,作为该企业产品的首个应用客户与市场。
2026年被业界普遍视为量产元年。宇树在去年售出5500多台人形机器人,位居全球首位,营收从1.59亿元显著增长至16.99亿元。智元则于3月正式下线了第1万台通用具身机器人。
然而,仔细审视这些数据,背后的细节值得深思。获得融资这一事实本身,并不直接等同于企业就能存活下去,这一残酷的商业逻辑,正在当下被一次次现实所印证。
达闼,这家曾经获得超过54亿元融资、估值一度突破200亿元的企业,在2025年的前七个月内仅实现了约140万元的销售额,并录得了8425万元的净亏损。
二、模型还是个孩子
固然人形机器人在消费市场上呈现出热闹的销售态势,然而,实际部署到工厂生产流水线进行常态化作业的机器人数量却非常稀少。问题并不在于其机械关节的灵活度不足,而主要源于其智能化水平存在不足,特别是感知、理解与自主决策能力。
在整个行业当中,正在逐步形成一项共识:高质量物理世界交互数据的稀缺性,正是制约具身智能发展的真正瓶颈所在。
全球范围内可用的真实机器人操作数据总量大约仅有50万小时,而大语言模型训练所消耗的文本数据量则是其两万倍以上。星海图的高继扬对此指出:“机器人智能的提升依赖于所学到知识的广度与深度,而非单纯依靠硬件产量的增加。”因此,核心逻辑在于数据驱动的学习过程,而非制造规模的扩大。
然而,为使机器人学会一个动作所需的数据,其特殊性在于它们无法通过网络爬取的方式来获得,这类信息必须依赖于机器人自身,在真实的物理环境中通过反复的试错过程来逐步积累与获取。
于是各家公司开始砸钱采数据。
星海图在亦庄地区启动并推进了一个百万小时真实数据采集计划;千寻智能则在全国范围内部署了超过30万个数据采集点;蚂蚁灵波从海量原始数据中筛选并提取了2万小时数据,专门用于训练其1.0版本的模型;京东计划在两年内累计收集达到1000万小时的数据。
然而,效果并不理想。智械岛对一位算法负责人进行了采访,他私下承认道,通过投入数千万元采集的10万小时数据,模型能力仅仅提升了5%。在A工厂学习到的技能,当转移到B工厂时,很可能无法正常工作。
技术路线同样没有定论。
过去一年,一个显著的技术趋势是视觉-语言-动作(VLA)模型与世界模型从对立走向了融合。VLA模型的核心路径是让机器人根据直接的视觉输入来执行动作,即“看到什么就做什么”。相比之下,世界模型则倡导了一种理念:机器人首先需要建立对外部世界物理规律的理解,然后才能规划并执行行动。前者聚焦于感知与动作的即时映射,后者则更注重建立内部表征与预测能力,这两种截然不同的范式在过去一年间逐渐走向互补与整合。
然而,无论沿着哪一条技术路线发展,模型自身的成熟程度目前都仍处于初期阶段。有从业人员提出了一个比喻说法:假如将终极的机器人能力设定为100分的标准,那么当前的工业机械臂,其技术成熟度评分约为50分;轮式底盘大约为40分;四足机器人的评分则在30分左右;而双足人形机器人的技术成熟度评分,则仅仅达到了15分的水平;灵巧手目前的技术得分只有5分;与其相配套的人工智能能力,得分更是仅有3分。
此外,业界持续讨论的另一个难点在于:目前尚缺乏公认的客观标准,用以评判模型性能的优劣。
破壳机器人公司的许华哲提及,当前行业中的一种盛行趋势是,各家机构倾向于通过榜单排名的提升和演示场景的对比来展示其成果。然而,这导致了一个关键问题:对于普通用户而言,他们无法像试用基于文本的生成式AI模型那样,方便地通过交互来直观感受一款机器人的实际能力。
对机器人能力的客观评估,应当通过将其部署到全新的场景中,考察其在多短的时间内便能独立执行作业任务来实现。
三、国家队下场修路
如果将全国范围内具身智能公司的分布情况绘制在地图之上,便会观察到一条清晰可见的分界线。
北京凭借其强大的产业集聚效应,在2026年上半年吸引了高达81笔融资,涉及金额达188.5亿元,这一数字占据了全国同期融资总额的四成。千寻智能、星海图与银河通用等头部企业均将核心研发中心设于此地,其业务重点在于推动机器人“大脑”算法与“本体”硬件的深度融合。
广东地区累计71笔融资,主要集中在硬件赛道,包括灵巧手以及关节模组等核心部件;江浙沪三地累计达到117笔融资,则更加侧重于应用场景的拓展,在工业喷涂、清洁服务以及家庭陪伴等领域推进实际落地。
具身智能产业的区域分工格局已基本确立:北京地区专注于算法研发与核心控制系统开发,广东地区侧重于机械结构制造与硬件组件生产,而江浙沪地区则聚焦于应用场景拓展与产业落地部署,形成了清晰的产业分工。
与此同时,城市之间的竞争在升温。
深圳市宝安区联合前海管理局,于5月8日共同正式发布了名为“具身智能港”的产业新地标项目。该项目的产业物理承载空间规模超过了500万平方米,并已成功吸引了包括腾讯、银河通用以及鹿明机器人在内的多家知名企业入驻。
上海设定的目标是在“十五五”规划期间,将10万台人形机器人部署到工厂生产线之中。此外,今年5月1日,全国首部专注于具身 智能机器人 的地方性法规已在杭州正式开始施行。
在政策层面,相关部门的动作力度显著加强。6月9日当天,工信部与国资委联合启动了本年度的实景实训专项行动。该行动旨在推动机器人进入工业、服务及特种领域的真实场景投入实际作业,并计划于年底之前,凝练并形成百个以上的高价值应用场景,从而带动形成万台级别的规模落地能力。
在维也纳举办的ICRA 2026国际机器人与自动化大会上,十余家中国科技公司的机器人产品在现场进行了一系列功能演示,内容涵盖了叠放衣物、倾倒液体以及拧紧螺丝等精细操作。这些高度的实用性与稳定性演示吸引了大量专业观众驻足围观,展台周围因此聚集了众多人群。
有人正举着手机拍摄机器人灵巧手精确捏起一枚螺丝钉的画面。旁边一位欧洲工程师向同行低声询问:“这一操作是否完全由机器人自主完成?”
关于这个问题的答案,至今无人能给出百分之百的肯定。在过去半年里,高达460亿人民币的资本涌入了具身智能这一热门赛道。这笔资金的规模相当可观,倘若将其全部兑换成面值一百元的纸币并首尾相连,其总长度足以从北京铺设到上海,再完整地往返一趟。然而,它所购得的,究竟会是一个即将步入爆发期的万亿规模产业,还是一系列精心制作的演示视频与融资通稿,这恰恰是所有人内心真正关切的核心疑虑所在。
根据IT桔子发布的统计数据,2026年上半年期间,国内具身智能及机器人领域共计发生了288起融资事件,涉及企业数量达到226家,所披露的融资总额超过了460亿元。将统计周期扩展至2025年7月至2026年6月,所呈现的数据则更为惊人:累计发生了503起融资事件,涉及金额超过960亿元。
在上半年,前五家公司——千寻智能、曦望Sunrise、星海图、自变量机器人以及极佳视界——共同完成了约171亿元的融资,这一数额占据了全行业融资总额的37%。如果将融资分布扩展至前20家公司,它们则通过市场地位获取了约七成的份额(约330亿元),而剩余的200多家公司只能共同分配不足三成的资金(约124亿元)。以千寻智能为例,该公司一家便融得45亿元,并在4个月内完成了4轮融资。
更值得深入探究的是资金的来源主体。传统风险投资机构在这一领域依然保持活跃,例如高瓴资本出手13次,红杉资本则进行了10次投资。但值得关注的是,在十亿元人民币及以上规模的大额融资领域,主导力量已经发生了显著转变。诸如百度、字节跳动、小米、美团、上汽集团、汇川技术以及各地方政府背景的投资平台等产业资本与国资主体,构成了新的投资方阵营。将产业资本与国有资本的份额合并计算,其总体占比已超过百分之四十。百度的投资路径较为明确,其同时参与了智平方B轮10亿元融资以及北京人形机器人创新中心A轮7亿元融资;美团与滴滴则完成了对地瓜机器人的投资;上汽方面在半年时间内完成了对4家具身智能公司的投资布局。
在数亿元及以上的大型融资交易中,国资扮演了主导角色,参与率高达42%,其介入方式更为直接。地方政府的行动遵循着一套清晰的“投资-落地-市场”逻辑:首先以资金进行投资,随后要求企业在当地建设生产基地,并同步将本地的工厂开放,作为该企业产品的首个应用客户与市场。2026年被业界普遍视为量产元年。宇树在去年售出5500多台人形机器人,位居全球首位,营收从1.59亿元显著增长至16.99亿元。智元则于3月正式下线了第1万台通用具身机器人。然而,仔细审视这些数据,背后的细节值得深思:获得融资这一事实本身,并不直接等同于企业就能存活下去,这一残酷的商业逻辑,正在当下被一次次现实所印证。
达闼,这家曾经获得超过54亿元融资、估值一度突破200亿元的企业,在2025年的前七个月内仅实现了约140万元的销售额,并录得了8425万元的净亏损。固然人形机器人在消费市场上呈现出热闹的销售态势,然而,实际部署到工厂生产流水线进行常态化作业的机器人数量却非常稀少。问题并不在于其机械关节的灵活度不足,而主要源于其智能化水平存在不足,特别是感知、理解与自主决策能力。在整个行业当中,正在逐步形成一项共识:高质量物理世界交互数据的稀缺性,正是制约具身智能发展的真正瓶颈所在。
全球范围内可用的真实机器人操作数据总量大约仅有50万小时,而大语言模型训练所消耗的文本数据量则是其两万倍以上。星海图的高继扬对此指出:“机器人智能的提升依赖于所学到知识的广度与深度,而非单纯依靠硬件产量的增加。”因此,核心逻辑在于数据驱动的学习过程,而非制造规模的扩大。然而,为使机器人学会一个动作所需的数据,其特殊性在于它们无法通过网络爬取的方式来获得,这类信息必须依赖于机器人自身,在真实的物理环境中通过反复的试错过程来逐步积累与获取。
星海图在亦庄地区启动并推进了一个百万小时真实数据采集计划;千寻智能则在全国范围内部署了超过30万个数据采集点;蚂蚁灵波从海量原始数据中筛选并提取了2万小时数据,专门用于训练其1.0版本的模型;京东计划在两年内累计收集达到1000万小时的数据。然而,效果并不理想。智械岛对一位算法负责人进行了采访,他私下承认道,通过投入数千万元采集的10万小时数据,模型能力仅仅提升了5%。在A工厂学习到的技能,当转移到B工厂时,很可能无法正常工作。
过去一年,一个显著的技术趋势是视觉-语言-动作模型与世界模型从对立走向了融合。VLA模型的核心路径是让机器人根据直接的视觉输入来执行动作,即“看到什么就做什么”。相比之下,世界模型则倡导了一种理念:机器人首先需要建立对外部世界物理规律的理解,然后才能规划并执行行动。前者聚焦于感知与动作的即时映射,后者则更注重建立内部表征与预测能力,这两种截然不同的范式在过去一年间逐渐走向互补与整合。然而,无论沿着哪一条技术路线发展,模型自身的成熟程度目前都仍处于初期阶段。有从业人员提出了一个比喻说法:假如将终极的机器人能力设定为100分的标准,那么当前的工业机械臂,其技术成熟度评分约为50分;轮式底盘大约为40分;四足机器人的评分则在30分左右;而双足人形机器人的技术成熟度评分,仅仅达到了15分的水平;灵巧手目前的技术得分只有5分;与其相配套的人工智能能力,得分更是仅有3分。
此外,业界持续讨论的另一个难点在于:目前尚缺乏公认的客观标准,用以评判模型性能的优劣。破壳机器人公司的许华哲提及,当前行业中的一种盛行趋势是,各家机构倾向于通过榜单排名的提升和演示场景的对比来展示其成果。然而,这导致了一个关键问题:对于普通用户而言,他们无法像试用基于文本的生成式AI模型那样,方便地通过交互来直观感受一款机器人的实际能力。对机器人能力的客观评估,应当通过将其部署到新的场景中,考察其在多短的时间内便能独立执行作业任务来实现。
如果将全国范围内具身智能公司的分布情况绘制在地图之上,便会观察到一条清晰可见的分界线。北京凭借其强大的产业集聚效应,在2026年上半年吸引了高达81笔融资,涉及金额达188.5亿元,这一数字占据了全国同期融资总额的四成。千寻智能、星海图与银河通用等头部企业均将核心研发中心设于此地,其业务重点在于推动机器人“大脑”算法与“本体”硬件的深度融合。广东地区累计71笔融资,主要集中在硬件赛道,包括灵巧手以及关节模组等核心部件;江浙沪三地累计达到117笔融资,则更加侧重于应用场景的拓展,在工业喷涂、清洁服务以及家庭陪伴等领域推进实际落地。具身智能产业的区域分工格局已基本确立:北京地区专注于算法研发与核心控制系统开发,广东地区侧重于机械结构制造与硬件组件生产,而江浙沪地区则聚焦于应用场景拓展与产业落地部署,形成了清晰的产业分工。
深圳市宝安区联合前海管理局,于5月8日共同正式发布了名为“具身智能港”的产业新地标项目。该项目的产业物理承载空间规模超过了500万平方米,并已成功吸引了包括腾讯、银河通用以及鹿明机器人在内的多家知名企业入驻。上海设定的目标是在“十五五”规划期间,将10万台人形机器人部署到工厂生产线之中。此外,今年5月1日,全国首部专注于具身智能机器人的地方性法规已在杭州正式开始施行。
在政策层面,相关部门的动作力度显著加强。6月9日当天,工信部与国资委联合启动了本年度的实景实训专项行动。该行动旨在推动机器人进入工业、服务及特种领域的真实场景投入实际作业,并计划于年底之前,凝练并形成百个以上的高价值应用场景,从而带动形成万台级别的规模落地能力。
然而,申请政策性资金并非易事。若接受国资入股,企业往往会面临一系列隐性约束条件,诸如被要求在特定区域内长期经营、签订对赌协议,以及股权的退出机制受到严格限制。
光伏产业此前的发展轨迹已提供了明确的前车之鉴。2024年,24家主要光伏企业所披露的合计亏损金额超过了286亿元。具身智能领域当前的国资参与率,已经与光伏产业发展早期阶段的水平大致相当。
出海则构成了另一条可行的发展路径。宇树这家企业的境外收入,常年保持在半数以上。
不过欧洲市场存在其独特的挑战,那里的用户消费习惯与其他市场存在显著差异,并且当地的监管体系也更为严苛。
四、结语
在宇树科技通过证监会审核的那个下午,审批人员在相关文件上加盖了批准印章,这标志着中国证券市场诞生了首家以具身智能技术为核心的A股上市公司。
尽管资本已经通过注入大量资金将行业赛道推进到了量产元年,但那些能够稳定工作并促使客户付费的机器人产品,尚未实现批量生产。
持乐观观点的人士则认为,无论是铁路泡沫、互联网泡沫还是新能源泡沫,这些产业都无一例外地先行点燃了市场的热情,真正的产业方能随之蓬勃发展。
持悲观态度的观察者进行测算后指出,在上半年,种子轮与天使轮阶段的融资累计金额不足13亿元,仅占该赛道总融资规模的3%。
一个缺乏大型科技企业背景以及显赫学术资历的年轻创业者,可能即便在思维中怀揣着具备行业颠覆潜力的构想,也依然很难获得接触风险投资人的初步机会。
达闼崩塌的故事在硬科技赛道从来不是孤例,每次回头复盘时所踩过的坑其实都大致相似——对技术成熟的速度做出了过高估计,对工程化的难度有所低估,最终才会发现,融资能力从来不等同于生存能力。
在产业发展的道路上,许多公司会逐渐落后,乃至最终消失,进而成为行业回顾与复盘时被引用的典型事例。这种现象并非出于悲观情绪,而是每一个新兴产业在发展过程中必须经历的市场出清阶段。
这个行业真正的答案,并非存在于融资新闻当中,也不位于招商文件之内,更不在榜单排名里,而是在那些还在跑的机器人身上。
它们是否能够持续运行一个完整的作业班次,能否促使客户主动提出追加的订单,能否让围观的外国工程师真正放下手机——原因并非仅仅在于展示的动作多么流畅或精巧,而是在于那些动作所指向的,是切实能够解决实际问题的效用。
原标题:千亿热钱砸不出具身智能的答案:Demo困在展厅,工厂等不来订单
在维也纳国际机器人与自动化大会的展馆中,超过十家来自中国的科技企业,正在现场对他们的机器人产品进行功能演示。这些演示内容涵盖了叠放衣物、倾倒液体以及拧紧螺丝等一系列需要精细操作的任务,其展现出的高度实用性与运行稳定性,吸引了大量专业观众驻足围观,使得展台周围聚集了众多人群。
此时,一位观众正举着手机,拍摄机器人灵巧手精确地捏起一枚螺丝钉的画面。站在旁边的一位欧洲工程师,则压低声音向同行提出了一个关键问题:“刚才这一系列操作,是否完全由机器人自主完成?”
关于这个问题的答案,至今没有人敢给出百分之百的肯定答复。
在过去的大约半年时间里,高达460亿人民币的资本涌入了具身智能这一热门赛道。这笔资金的规模相当可观,倘若将其全部兑换成面值一百元的纸币并首尾相连,其总长度足以从北京一直铺设到上海,再完整地往返一趟。然而,人们真正关切的核心疑虑在于:这笔巨额投资最终换来的,究竟是一个即将步入爆发期的万亿规模产业,还仅仅是一系列精心制作的演示视频与融资通稿?
根据IT桔子发布的统计数据,在2026年上半年期间,国内具身智能以及机器人领域累计发生了288起融资事件,所涉及的企业数量达到了226家,披露的融资总额超过了460亿元。如果将统计周期扩展至2025年7月至2026年6月这一整年时间,所呈现的数据则更为惊人:累计发生了503起融资事件,涉及金额超过了960亿元。
在上半年,前五家公司——千寻智能、曦望Sunrise、星海图、自变量机器人以及极佳视界——共同完成了约171亿元的融资,这一数额占据了全行业融资总额的37%。将范围扩大到前20家公司,它们则凭借其市场地位,获取了约七成的份额(约330亿元),而剩余的200多家公司,只能共同分配不足三成的资金(约124亿元)。以千寻智能为例,该公司一家便融得45亿元,并在短短4个月内完成了4轮融资。
更值得深入探究的是,这些资金究竟来源于哪些投资主体。传统风险投资机构在这一领域依然保持活跃,例如高瓴资本出手13次,红杉资本则进行了10次投资。但值得关注的一个显著转变是,在十亿元人民币及以上规模的大额融资领域,主导力量已经发生了变化。诸如百度、字节跳动、小米、美团、上汽集团、汇川技术以及各地方政府背景的投资平台等产业资本与国资主体,构成了新的投资方阵营。如果将产业资本与国有资本的份额合并计算,其总体占比已超过百分之四十。百度的投资路径较为明确,其同时参与了智平方B轮10亿元融资以及北京人形机器人创新中心A轮7亿元融资;美团与滴滴则完成了对地瓜机器人的投资;上汽方面在半年时间内完成了对4家具身智能公司的投资布局。
在数亿元及以上的大型融资交易中,国资扮演了主导角色,参与率高达42%,其介入方式更为直接和系统化。地方政府的行动遵循着一套清晰的“投资-落地-市场”逻辑:首先以资金进行战略投资,随后要求企业在当地建设生产基地,并同步将本地的工厂开放,作为该企业产品的首个应用客户与市场,以此形成一个闭环。
2026年被业界普遍视为具身智能的量产元年。宇树在去年售出5500多台人形机器人,位居全球首位,其营收从1.59亿元显著增长至16.99亿元。智元机器人则于今年3月,正式下线了其第1万台通用具身机器人。
然而,仔细审视这些看似光鲜的数据,其背后的细节值得深思:获得融资这一事实本身,并不直接等同于企业就能存活下去,这一残酷的商业逻辑,正在当下被一次次现实所印证。
以达闼为例,这家曾经获得超过54亿元融资、估值一度突破200亿元的企业,在2025年的前七个月内仅实现了约140万元的销售额,并录得了8425万元的净亏损。固然,人形机器人在消费市场上呈现出热闹的销售态势,然而,实际部署到工厂生产流水线进行常态化作业的机器人数量却非常稀少。问题并不在于其机械关节的灵活度不足,而主要源于其智能化水平存在不足,特别是感知、理解与自主决策能力。在整个行业当中,正在逐步形成一项共识:高质量物理世界交互数据的稀缺性,正是制约具身智能发展的真正瓶颈所在。
全球范围内可用的真实机器人操作数据总量大约仅有50万小时,而大语言模型训练所消耗的文本数据量则是其两万倍以上。星海图的高继扬对此指出:“机器人智能的提升依赖于所学到知识的广度与深度,而非单纯依靠硬件产量的增加。”因此,核心逻辑在于数据驱动的学习过程,而非制造规模的扩大。然而,为使机器人学会一个动作所需的数据,其特殊性在于它们无法通过网络爬取的方式来获得,这类信息必须依赖于机器人自身,在真实的物理环境中通过反复的试错过程来逐步积累与获取。
为应对这一挑战,星海图在亦庄地区启动并推进了一个百万小时真实数据采集计划;千寻智能则在全国范围内部署了超过30万个数据采集点;蚂蚁灵波从海量原始数据中筛选并提取了2万小时数据,专门用于训练其1.0版本的模型;京东计划在两年内累计收集达到1000万小时的数据。然而,效果并不理想。智械岛对一位算法负责人进行了采访,他私下承认道,通过投入数千万元采集的10万小时数据,模型能力仅仅提升了5%。更严峻的现实是,在A工厂学习到的技能,当转移到B工厂时,很可能因为环境差异而无法正常工作。
过去一年,一个显著的技术趋势是视觉-语言-动作模型(VLA)与世界模型从对立走向了融合。VLA模型的核心路径是让机器人根据直接的视觉输入来执行动作,即“看到什么就做什么”。相比之下,世界模型则倡导了一种理念:机器人首先需要建立对外部世界物理规律的理解,然后才能规划并执行行动。前者聚焦于感知与动作的即时映射,后者则更注重建立内部表征与预测能力,这两种截然不同的范式在过去一年间逐渐走向互补与整合。然而,无论沿着哪一条技术路线发展,模型自身的成熟程度目前都仍处于初期阶段。有从业人员提出了一个比喻说法:假如将终极的机器人能力设定为100分的标准,那么当前的工业机械臂,其技术成熟度评分约为50分;轮式底盘大约为40分;四足机器人的评分则在30分左右;而双足人形机器人的技术成熟度评分,仅仅达到了15分的水平;灵巧手目前的技术得分只有5分;与其相配套的人工智能能力,得分更是仅有3分。
此外,业界持续讨论的另一个难点在于:目前尚缺乏公认的客观标准,用以评判模型性能的优劣。破壳机器人公司的许华哲提及,当前行业中的一种盛行趋势是,各家机构倾向于通过榜单排名的提升和演示场景的对比来展示其成果。然而,这导致了一个关键问题:对于普通用户而言,他们无法像试用基于文本的生成式AI模型那样,方便地通过交互来直观感受一款机器人的实际能力。在他看来,对机器人能力的客观评估,应当通过将其部署到全新的场景中,考察其在多短的时间内便能独立执行作业任务来实现。
如果将全国范围内具身智能公司的分布情况绘制在地图之上,便会观察到一条清晰可见的分界线。北京凭借其强大的产业集聚效应,在2026年上半年吸引了高达81笔融资,涉及金额达188.5亿元,这一数字占据了全国同期融资总额的四成。千寻智能、星海图与银河通用等头部企业均将核心研发中心设于此地,其业务重点在于推动机器人“大脑”算法与“本体”硬件的深度融合。广东地区累计获得71笔融资,主要集中在硬件赛道,包括灵巧手以及关节模组等核心部件;江浙沪三地累计达到117笔融资,则更加侧重于应用场景的拓展,在工业喷涂、清洁服务以及家庭陪伴等领域推进实际落地。至此,具身智能产业的区域分工格局已基本确立:北京地区专注于算法研发与核心控制系统开发,广东地区侧重于机械结构制造与硬件组件生产,而江浙沪地区则聚焦于应用场景拓展与产业落地部署,形成了清晰的产业分工。
在政策与基础设施层面,各地的动作力度显著加强。深圳市宝安区联合前海管理局,于5月8日共同正式发布了名为“具身智能港”的产业新地标项目。该项目的产业物理承载空间规模超过了500万平方米,并已成功吸引了包括腾讯、银河通用以及鹿明机器人在内的多家知名企业入驻。上海设定的目标是在“十五五”规划期间,将10万台人形机器人部署到工厂生产线之中。此外,今年5月1日,全国首部专注于具身智能机器人的地方性法规已在杭州正式开始施行。
在中央层面,相关部门的行动同样迅速。6月9日当天,工信部与国资委联合启动了本年度的实景实训专项行动。该行动旨在推动机器人进入工业、服务及特种领域的真实场景投入实际作业,并计划于年底之前,凝练并形成百个以上的高价值应用场景,从而带动形成万台级别的规模落地能力。
然而,申请政策性资金并非易事。若接受国资入股,企业往往会面临一系列隐性约束条件,诸如被要求在特定区域内长期经营、签订对赌协议,以及股权的退出机制受到严格限制。光伏产业此前的发展轨迹已提供了明确的前车之鉴。2024年,24家主要光伏企业所披露的合计亏损金额超过了286亿元。具身智能领域当前的国资参与率,已经与光伏产业发展早期阶段的水平大致相当。
出海则构成了另一条可行的发展路径。宇树这家企业的境外收入,常年保持在半数以上。不过欧洲市场存在其独特的挑战,那里的用户消费习惯与其他市场存在显著差异,并且当地的监管体系也更为严苛。
在宇树科技通过证监会审核的那个下午,审批人员在相关文件上加盖了批准印章,这标志着中国证券市场诞生了首家以具身智能技术为核心的A股上市公司。然而,尽管资本已经通过注入大量资金将行业赛道推进到了量产元年,但那些能够稳定工作并促使客户付费的机器人产品,尚未实现批量生产。
持乐观观点的人士则认为,无论是铁路泡沫、互联网泡沫还是新能源泡沫,这些产业都无一例外地先行点燃了市场的热情,真正的产业方能随之蓬勃发展。持悲观态度的观察者进行测算后指出,在上半年,种子轮与天使轮阶段的融资累计金额不足13亿元,仅占该赛道总融资规模的3%。这意味着,一个缺乏大型科技企业背景以及显赫学术资历的年轻创业者,可能即便在思维中怀藏着具备行业颠覆潜力的构想,也依然很难获得接触风险投资人的初步机会。
达闼崩塌的故事在硬科技赛道从来不是孤例,每次回头复盘时所踩过的坑其实都大致相似——对技术成熟的速度做出了过高估计,对工程化的难度有所低估,最终才会发现,融资能力从来不等同于生存能力。在产业发展的道路上,许多公司会逐渐落后,乃至最终消失,进而成为行业回顾与复盘时被引用的典型事例。这种现象并非出于悲观情绪,而是每一个新兴产业在发展过程中必须经历的市场出清阶段。
这个行业真正的答案,并非存在于融资新闻当中,也不位于招商文件之内,更不在榜单排名里,而是在那些还在持续运行的机器人身上。它们是否能够持续运行一个完整的作业班次,能否促使客户主动提出追加的订单,能否让围观的外国工程师真正放下手机——原因并非仅仅在于展示的动作多么流畅或精巧,而是在于那些动作所指向的,是切实能够解决实际问题的效用。
来源:千亿热钱砸不出具身智能的答案: Demo 困在展厅,工厂等不来订单 | OFweek机器人网