星海图脑成身就项目将SOTA大脑装进双足人形机器人

2026年06月03日 11:23
本文共计3013个字,预计阅读时长11分钟。
来源/具身研习社 责编/爱力方

作者:彭堃方     编辑:吕鑫燚     出品:具身研习社

具身智能人形机器人,终于走到了交汇处。

很长一段时间里,这是两条并行、互不交汇的路。一条属于具身智能,追求的是能理解世界、举一反三、什么活都能上手的通用大脑;另一条属于人形机器人,更憧憬重塑越来越像人的身体,会走、会跑、会跳,动作像人一样灵巧。

两种想象力都足够宏大,却始终没能守望相助。大脑要阶段性落地,承载它的多半还是轮式底盘;身体再像人,缺了一颗能干活的脑,也只是一具炫技的空壳。

一边在等身体,一边在等大脑,两条线缺乏强耦合,迟迟未能相交。

把这两条线搓成一股,对一家公司的要求其实很高。脑要足够泛化,身体要足够扎实,背后还要有从模型、运动控制到硬件整机的全栈能力。差强人意的脑驱动不了硬件真正干活,不够可靠的双足连站稳都费劲,更撑不起一颗想干活的脑。

就在刚刚,星海图正式推出自研双足人形机器人行客 Kengo。其硬件性能依旧延续星海图的高性能优势,而且这次发布卡在了一个非常重要的节点。因为这一次,星海图把自己的身体路线推进到了双足人形。它给那颗已经被行业反复验证的具身大脑,准备了一副更接近人类世界的身体。

顺序是关键。先有能干活的脑,再让身体长出来。星海图把这套逻辑称作先有“能干活的脑”,才有“会走路的腿” 。脑先立住,身体才有了被造出来的理由。等行客 Kengo 后续真正搭载具身大脑模型,那种被压抑许久的、属于“人形”的想象力,才会迎来释放的机会。

放到产业的尺度上看,这或许意味着,具身智能开始迈进“脑体共振”的新阶段。

19f0acec56067316c6e834c4d51b4d2d.png

很多人形机器人发布时,最先被看见的往往是动作:会不会走,能不能跑,跳得稳不稳,摔倒之后能不能爬起来。这些能力当然重要,因为双足是最接近人类空间的机器人形态,也最考验一家公司的工程底座。

但如果只剩动作,人形机器人很容易停留在表演层面。它可以让人惊艳,却很难让人相信它真的能长期进入真实场景,承担任务,创造价值。行客 Kengo 想回答的是走起来之后的问题

0043766ccfdef795ac8dd2abe064b309.jpg

图片来源:星海图

行客 Kengo以高性能运动小脑与具身大脑为核心,能够完成多种高难度极限动作,具备动态环境下的自主平衡与地形适应能力。按照星海图的规划,后续行客 Kengo 将搭载具身大脑模型,提升语义理解与任务规划能力,面向诸多真实使用场景,成为具身智能双足机器人的生产力标杆。

这里最值得看见的,是“生产力”。

一具真正有生产力想象的双足身体,首先要经得起真实世界的折腾。行客 Kengo 采用 1.4 米身高,双足设计,头部搭载曲面屏,配合灯光轮廓,科技感和辨识度都很强。整机高动态、高爆发,轻量化机身带来更强的灵活度,单关节扭矩超过 130N·m,可以完成舞蹈、互动等高难度动作。

这些动作能力构成了 Kengo 的第一层证明:它动得起来,也动得足够好。

但真正面向落地,机器人不能只在视频里漂亮。它还要摔得起、用得久、维护成本可控。Kengo 采用高可靠性整机设计,倒地跌落 10 次依旧完好;全中空模组结构让线束折弯寿命超过 20 万次,能够支撑长期稳定运行。更进一步,全身关节只用两款核心模组覆盖,高标准化设计让成本更可控,也更适合批量化应用。

这些指标拼到一起,Kengo 想讲的就不再是市面上又多了一台“表演双足”。它是在回答一个更严肃的问题:一具双足人形身体,如何从发布会上的动作展示,走向长期运行、稳定迭代和真实使用,最终在人类社会生产生活中展现价值。

所以,Kengo 的意义就在于,它给星海图的大脑准备了一个更难、也更有想象力的物理入口。

74e5c1e7049c40a2f77613aaab8d4e51.png

如果只看今天发布的行客 Kengo,它已经是一具完成度很高的双足人形身体。但把它放回星海图的整体路线里,它真正的想象力,来自后续要装上的那颗大脑。

星海图日前发布的 G0.5,是其具身基础模型能力的新推进。G0.5 解决了大部分 VLA 被诟病的问题——只会执行见过的任务,G0.5 要做的是让机器人从“记住任务”走向“学会操作”。

4e3e53476797bd8b153b2b5918fcf0ce.jpg

图片来源:星海图

它通过大规模、多任务预训练,把抓取、放置、推拉、开合、移动等基础动作,从具体任务轨迹中沉淀出来,变成可迁移、可组合、可复用的能力单元。这样一来,机器人面对新的物体、新的空间布局和新的自然语言指令时,不再只是检索自己见过什么,而是调用自己学会的操作能力。

从榜单来看,这套架构取得显著成绩。G0.5 在 LIBERO 上拿到 98.9%,RoboTwin 93.3%,SimplerEnv-Bridge 87.3%,DROID 零样本 82.5%,真机微调 76.7%;在斯坦福团队发布的大规模长程仿真基准 BEHAVIOR-1K 上,单一模型超过原冠军 11.5 个百分点。横向看,它的大脑能力已经比肩全球顶尖的 π0.7,泛化能力站上全球第一梯队

至此,Kengo 解决了身体能不能进入世界的问题,G0.5 解决了进入世界之后能不能理解任务的问题。前者扩大机器人的行动半径,后者提高机器人在新场景中的适应能力。它们放在一起,才构成星海图这次发布最值得想象的部分。

后续当 G0.5 真正装进 Kengo,那时的 Kengo 就不再只是能走、能跳、能互动的双足身体,而是一台有机会理解指令、规划任务、适应环境、持续行动的具身智能体。它不再只是完成某个被提前编排好的动作,而是有机会在诸多真实使用场景里,根据任务、环境和反馈持续做出判断。

这才是“把 SOTA 大脑装进双足人形”的真正含义。

在业内,人形机器人容易被两种想象撕扯。一种想象停留在身体,关注它像不像人、动得是否流畅、展示是否惊艳;另一种想象停留在大脑,关注模型指标、泛化能力、评测成绩。星海图这次把 Kengo 和 G0.5 放到一起,试图把这两种想象拉回同一个问题:机器人能不能真正成为一个有生产力的具身智能体。

ae7ba905a6b6297e5b840f66f92b09ca.png

先回答一个问题:凭什么是星海图做成了这件事?

答案是全栈。星海图最初成立,从一开始就立定“整机 + 智能”的战略,把“大脑(G 系列基础大模型)× 小脑(运动控制)× 本体(硬件整机)”三位一体地攥在自己手里,全栈自研。这种布局让它既能把脑做到第一梯队的泛化,又能让身体和脑彼此适配、同步迭代。顺便一说,星海图此前在轮式双足已经做到了头部覆盖率90%,到今天,它已服务斯坦福、Physical Intelligence、华为等全球近百家顶尖客户,累计融资近 50 亿元,是一家把整机能力做到顶尖的模型公司。

回到开头那条线索,具身智能和人形机器人之所以能在此刻交汇,是因为终于有一方先成熟到了足以去定义另一方的程度。过去做这件事的人,要么埋头做模型,要么单独磕人形本体,两套叙事各说各话;如今它们被拧到一起,能迸发的想象力也随之翻倍,一个会理解、懂规划,真正具备通用落地能力的模型到来,加上一具走得稳、扛得住的身体,能去的地方远比从前宽广。

ee2622630548333ffe1d047a43ff5760.png

图片来源:星海图

也正因如此,软硬件之争或许可以休矣。“硬件和软件谁更依赖谁?”这个话题可以先放一放了。倒不是谁赢了、有了定论,而是星海图摆出了一个样本:脑和身体可以同步推进,并且同时做到最优。一家公司把全栈能力握在手中,让大脑领着方向、身体随着跟上,两者在同一套工具链里一起成熟,谁依赖谁的问法,自然就没那么要紧了。

当大脑与身体真正交融,具身智能将被推向更开阔的地带,以生产力的角色真正融入物理世界。这也代表着具身智能竞争有了新切口,模型和本体不再是单独叙事,而是 1+1>2 的全栈能力。

在这条脉络上,星海图用实践证明,它是通用具身智能的必经之路。

来源:“脑成身就”的星海图,把 SOTA 大脑装进双足人形 | 具身研习社

声明:本文来自具身研习社,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/