智元开源行业首个世界模型专属具身数据集,让机器人通过多样交互理解真实世界
2026年6月3日,智元正式宣布开源AGIBOT WORLD 2026数据集第二期,其主题为“多样交互”(Rich Interaction)。作为行业首个聚焦物理交互的开源具身数据集,它针对世界模型、神经仿真器、物理感知以及表征学习等具身智能研究,系统记录机器人与真实物理世界之间复杂、高密度且非理想的交互过程,旨在补齐当前世界模型训练中长期缺失的真实物理交互数据。
本期数据集已通过Hugging Face平台提供公开下载。在前期发布以“模仿学习”为核心主题的首期数据集的基础上,AGIBOT WORLD 2026进一步将数据建设的范畴,从专家示范与成功轨迹,拓展至真实环境中更为复杂、更具不确定性,且更贴近物理世界本质的交互学习阶段。
长期以来,具身智能领域的数据集大多围绕标准任务、专家示范以及成功案例来展开构建。然而,真实世界并不总是处于理想、稳定以及可控的状态当中。机器人在现实环境之中会频繁地遭遇抓取失败、物体滑落、意外碰撞、液体飞溅、布料变形等各类非标准情境。对于人类而言,这些均属于日常生活中习以为常的经验;但对于机器人来说,它们恰恰构成了理解接触、摩擦、重心、形变以及反馈等物理规律的关键入口。
为了弥补当前世界模型训练环节中长期缺乏的真实物理交互数据,智元推出了AGIBOT WORLD 2026第二期以“多样交互”为主题的数据集。与传统具身智能数据集通常只专注于采集“成功示范案例”的逻辑不同,智元本次开源的“多样交互”数据集,系统性地关注并保留了非理想行为的研究价值。该数据集基于百分之百的真实场景进行采集,全面记录了机器人与具备不同材质、形态及结构的物体之间所产生的丰富物理互动,其内容覆盖了成功与失败、预期与意外、稳定与混沌等多种交互状态。通过开放这批数据,智元期望为世界模型提供一个更贴近真实世界运行规律的数据基础,从而推动机器人从“学习如何完成任务”的阶段,进一步向“理解自身动作如何改变世界”的更深层次迈进。
这些过去往往被视为"失败"或"噪声"的数据,正在逐步成为世界模型研究领域当中极具价值的资产。对于世界模型而言,如果训练数据仅包含标准动作以及成功示范,那么模型往往容易停留在对成功状态的简单拟合之上。当面对少见动作、复杂接触以及各种非理想情况时,模型可能会难以准确地预测真实世界当中的失败分布与物理演化规律。只有经历过足够丰富的成功与失败过程,模型才能够更好地模拟真实的未来场景,从而减少那些不符合物理规律的生成结果。
智元借助基于其世界模型仿真器Genie Envisioner-Sim 2.0开展的实验,验证了多样交互数据以及失败数据对于提升动作条件世界模型(Action-Conditioned World Model)建模能力所具有的重要意义。相较于仅基于成功示范进行训练的模型,纳入了更为丰富的动作分布、接触过程以及非理想交互结果的数据,能够帮助模型更加准确地理解"动作如何改变世界"这一核心问题,并且有助于提升未来状态预测方面的物理一致性。
本期数据集的发布,标志着具身智能的数据建设正逐步迈入新的发展阶段。过去,机器人主要聚焦于学习“如何成功地执行动作”;如今,机器人则需要进一步去学习对世界进行建模,即理解“真实世界会如何回应动作”。从成功案例延伸到失败情境,从动作指令深入到物理反馈,从任务完成度的考量提升至对世界运作规律的理解层面,AGIBOT WORLD 2026正致力于为下一代的世界模型、机器人学习以及物理智能研究,构建起更为完整的数据底座。
通过开源“多样交互”数据集,智元旨在为全球研究者提供关键支持,共同探索真实物理世界中的复杂交互规律,以此加速世界模型、具身智能以及物理智能等前沿领域的研究与发展进程。
开源地址:huggingface.co/datasets/agibot-world/AgiBotWorld2026
来源:智元开源行业首个专属于世界模型的具身数据集,让机器人从“多样交互”中理解真实世界 | 机器人大讲堂