前NVIDIA工程师用强化学习让人形机器人担任办公室实习生

2026年07月02日 18:35
本文共计1515个字,预计阅读时长6分钟。
来源/OFweek机器人网 责编/NuanxinXiaoMo 暖心小茉

来源:Wired    作者:Will Knight

人形机器人能跑能跳,但离真正有用还差一步。一家由前NVIDIA工程师创办的瑞士创业公司Flexion用“强化学习”让机器人自主学会了开门、爬楼梯、搬箱子——办公室杂务的末日还会远吗?

人形机器人可以跑步、跳舞,偶尔还能踢人一脚。但要真正“像个人”,它们还得学会做各种办公室杂活。现在,一家由前NVIDIA机器人研究员创办的瑞士创业公司Flexion Robotics认为自己找到了答案。该公司开发了一套方法,能训练机器人执行复杂任务,包括开门、爬楼梯和搬箱子。关键在于先在模拟环境中教机器人单个技能,然后让一个“主AI算法”决定如何组合使用它们。

大多数机器人演示视频展示的是已经被训练好去做某一件特定事情的机器人,比如叠衬衫或上货架。通常这种训练是通过“遥操作”完成的——幕后有个人控制机器人的动作。但这种方法在机器人进入陌生环境时就不太可靠了。Flexion声称它的系统不同——更高效——因为它在模拟环境中训练机器人,仅需有限的人类指令。

一台宇树机器人的“职场秀”

在一段演示视频中,一台经过改装的宇树(Unitree)人形机器人接到指令:“一个装零食的包裹已送到Flexion。请走楼梯去取,然后坐电梯上来。打开它,把零食放进零食区架子上的空抽屉里。”机器人完全自主地执行了这一系列动作。它能做到这一点,靠的是组合不同的AI系统。

主AI模型通过“观看”人类做各种事情的视频来理解该做什么——比如要去邮件室,它知道需要开某些门、使用电梯。但视频只教它“什么时候做什么动作”,不教它“怎么物理执行”。接着软件触发它在模拟环境中学会的技能,并在真实世界中执行。系统还同时控制机器人的电机,让它能行走、移动四肢、保持平衡。

“强化学习”是秘密武器

图片来源:Wired

据Flexion联合创始人兼CEO、前NVIDIA机器人科学家Nikita Rudin介绍,这套软件的“秘密配方”是大规模使用“强化学习”——让计算机通过反复试错来掌握任务。从主AI模型到模拟环境到电机控制,软件的每一层都采用了这种方法。“人形机器人本身并不是有趣的、革命性的东西,”分析师George Chowdhury说,“真正重要的是支撑它们的AI模型。”

ABI Research估计,到2036年,机器人基础模型市场规模可达1500亿美元。Flexion正在与多家机器人公司合作,并强调其软件可以跨不同人形机器人平台使用。Chowdhury指出,Flexion需要与硬件制造商紧密合作才能成功,且将面临激烈竞争。但如果没有Flexion展示的这种编程能力,“这个市场根本不存在”。

“办公室实习生”背后的商业逻辑

Elon Musk和黄仁勋等科技领袖人物认为,人形机器人将对经济产生巨大影响,因为它们最终可能替代大量人类劳动。但Flexion的演示反映了一个事实:赋能人形机器人需要AI的根本性进步。目前市场上的人形机器人硬件日益成熟,但缺少的是让它们能够自主学习和适应的“大脑”。Flexion的强化学习方案如果能够规模化,可能会成为解锁人形机器人商业化的关键钥匙。

值得关注的是,Flexion选择的是“软件优先”路线——而非自己制造机器人硬件。这种策略与NVIDIA提供“机器人大脑”的思路类似,都是在硬件商品化的同时,靠软件和AI来分一杯羹。在机器人行业的“掏金热”中,“卖铄铲”的硬件商和“卖地图”的软件商,谁能笑到最后,答案还远未揭晓。

       原文标题 : 人形机器人当上办公室实习生,前NVIDIA工程师的“强化学习”之路

来源:人形机器人当上办公室实习生,前NVIDIA工程师的“强化学习”之路 | OFweek机器人网

声明:本文来自OFweek机器人网,版权归作者所有。文章内容仅代表作者独立观点,不代表爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 爱力方

https://www.agentren.cn/