大晓机器人Kairos开源模型在打破“外挂式”改良局限的同时，登顶全球四项权威评测。

2026年06月12日 19:44

本文共计2660个字，预计阅读时长9分钟。

来源/OFweek机器人网责编/XingzheWujiang 行者无疆

在全球针对世界模型视频生成和状态预测的最新具身智能评测中，大晓机器人（ACE ROBOTICS）自主研发的开源“开悟世界模型”（Kairos）在技术上实现了重大突破。该模型在RoboTwin 2.0、LIBERO-Plus、WorldModelBench Robot以及DreamGen四大国际权威基准测试中均位列全球第一。

评测数据显示，Kairos模型的性能指标在所有测试项目上均超越了Cosmos3、PI、MotuBrain、being-H0.7、Abot、Fast-WAM以及Wan2.2等全球主流世界模型。特别是在具身视频生成、任务指令追随、泛化能力以及应对复杂环境的鲁棒性等多个评估维度上，Kairos均展现出全方位的领先地位。

一、将创新一体化架构与全链路闭环落地

打破“外挂式”改良，大晓机器人Kairos开源模型登顶全球四项权威评测

为了有效应对行业内普遍依赖视频生成模型进行后训练所导致的物理特性缺失、因果关系匮乏以及推理延迟等关键挑战，大晓机器人在2025年12月正式推出了创新的原生统一世界模型架构，也就是实现了多模态理解、生成与预测功能的一体化架构。研发团队彻底摒弃了传统上采用的外挂式改良方法，坚持自主进行网络架构与预训练范式的设计工作，从而深度融合了理解、生成以及预测这三大核心能力。该模型借助自主研发的混合线性注意力算子和全局状态共享机制，成功实现了全链路的高效协同处理，这一技术路线同样与英伟达最新发布的Cosmos 3.0保持同源。

在数据与模型开发层面，Kairos汇集了十余万小时以人类为中心（human-centric）的实景数据，以及数百万小时源自互联网的真实世界视频，其数据覆盖范围广泛，包含了数百类不同的职业与应用场景。模型借助将显式的模仿学习与隐式的空间强化学习进行有机结合的方式，成功打通了从原始数据感知到深层语义理解的技术闭环，并在场景认知、时序因果推演以及跨域泛化适配等多个关键维度上实现了显著的技术突破。

借助此架构以及高质量数据的支撑，大晓机器人推出了轻量化的Kairos-4B模型。作为全球首款能够端侧直驱机器人本体的具身世界模型，Kairos-4B成功打通了从世界理解到状态预测的端到端闭环，有效消除了由中间层转译所造成的运行延迟，从而在提升机器人实时响应能力与作业精度方面开辟了全新的技术路径。

这一技术成果将依托于大晓机器人首创的ACE研发范式，致力于构建起涵盖“环境式数据采集—开悟世界模型3.0版本（Kairos 3.0）—泛化具身模组”在内的全链路技术体系。大晓机器人由商汤科技联合创始人、执行董事王晓刚出任董事长，并邀请世界级AI科学家陶大程院士担任首席科学家。为了解决具身智能行业目前所面临的数据匮乏、常识缺失、泛化困难以及通用性不足等核心挑战，公司同步推出了“具身超级大脑模组A1”，并借助与芯片厂商、硬件厂商、云服务商及垂直场景伙伴的深度战略合作，积极推动该模组在安防、巡检、服务等多元化场景的规模化部署与商业化落地。

在RoboTwin 2.0、LIBERO-Plus、WorldModelBench Robot以及DreamGen这四项全球性的权威具身智能评测中，开悟世界模型Kairos在详实的实验数据支撑下，呈现出了其在执行复杂操作任务、保持运行鲁棒性、进行物理动态建模以及实现真实世界场景泛化等多个关键技术维度上的卓越性能。

RoboTwin 2.0（复杂双臂操作评测）：该基准测试由上海交通大学、香港大学及上海人工智能实验室等机构的研究团队联合推出，其评测内容涵盖了50项复杂的协作操作任务。根据评测数据反馈，Kairos模型凭借96.1%的平均成功率，在所有参评方法中位列第一。具体而言，该模型在标准（Clean）场景中达到了96.9分，而在随机化（Randomized）场景中取得了95.2分。这一成绩不仅高于AIM（93.1分）、Fast-WAM（91.8分）和MotuBrain（96.0分）等主流世界模型，同时也超越了G0.5（93.2分）和starVLA（88.3分）等传统视觉-语言-动作（VLA）模型。

LIBERO-Plus（场景级泛化能力评测）：该基准由上海创智学院、复旦大学、同济大学以及新加坡国立大学的研究团队共同提出，其目的在于对模型的鲁棒性进行系统性评估。评测方案通过模拟包括相机视角、光照条件、背景环境与噪声干扰在内的七种真实场景变量，来检验模型在复杂变化下的适应能力。根据评测数据反馈，Kairos取得了89.0分的总成绩，位列所有参评方法的第一名。相较于同为世界模型的Being-H0.7（84.8分），以及ACoT-VLA（88.0分）、Pi 0.5（85.7分）和ProGAL-VLA（85.5分）等主流VLA模型，该模型的性能实现了显著超越。在三个核心的子维度评测中，Kairos在光照（97.7分）、背景（95.8分）以及噪声（96.8分）方面均获得了接近满分的表现。

打破“外挂式”改良，大晓机器人Kairos开源模型登顶全球四项权威评测

WorldModelBench Robot（世界建模能力测试）：该基准由加州大学伯克利分校、加州大学圣迭戈分校、英伟达以及麻省理工学院联合推出，主要用于评估指令遵循和未来帧生成能力。Kairos-4B以4B参数量超越了Lingbot-28B、Cosmos3-16B、Abot-Physworld-14B和Wan2.2-5B等更大规模模型，以9.30分夺冠。指令遵循得分达2.36，与Cosmos3-16B并列全球第一；物理遵循维度取得4.96分，其中牛顿力学、重力两大核心物理规律维度及整体时序质量指标均达到满分1.00分。

打破“外挂式”改良，大晓机器人Kairos开源模型登顶全球四项权威评测

DreamGen Bench（真实场景泛化能力评测）：这一基准测试由英伟达公司联合华盛顿大学、加州大学伯克利分校以及加州大学洛杉矶分校等多所国际顶尖高校的研究团队共同提出。在本次评测中，开悟世界模型Kairos凭借卓越性能斩获了两项关键性的全球第一，分别是平均物理遵循得分（AVG_PA 0.538）与总平均得分（AVG_Score 0.618）。在核心的三大泛化测试场景中，Kairos模型在物理遵循维度下的新行为执行能力得分（0.489）与新环境适配能力得分（0.581）均位居所有参评方法之首；同时，在指令遵循维度下，其新行为执行能力得分也达到了0.745并取得第一名。这些结果表明，Kairos在所有关键评测指标上均位列第一，其性能显著优于Cosmos3、Lingbot以及Wan2.2等主流世界模型。

打破“外挂式”改良，大晓机器人Kairos开源模型登顶全球四项权威评测