​腾讯推出具身多模态大模型 HY-Embodied-0.5-X,赋能机器人智能交互

2026年04月27日 16:43
本文共计843个字,预计阅读时长3分钟。
来源/aibase 责编/爱力方

近日,腾讯 Robotics X 实验室与混元团队共同发布并开源了 HY-Embodied-0.5-X,这是一款专为具身任务优化的多模态大模型,旨在提升机器人在真实环境中的智能交互能力。该模型基于 HY-Embodied-0.5-MoT-2B 架构,强调机器人在 “看懂、想清、做到” 方面的核心能力,尤其在精细操作、空间推理、动作预测及风险判断等方面表现优越。

image.png

HY-Embodied-0.5 系列包含两个主要版本:MoT-2B 和 MoE-32B。MoT-2B 设计为端侧部署,具备实时响应能力,而 MoE-32B 则具有更大规模的参数,支持更复杂的任务处理。HY-Embodied-0.5-X 尤其专注于机器人在真实交互中的应用,推动从 “看懂” 走向 “干活”,并且为家庭服务和桌面操作等实际应用场景提供强有力的支持。

在数据方面,HY-Embodied-0.5-X 结合了自采的机器人第一视角操作数据和开源具身数据,构建出高质量的训练数据集。该数据集不仅涵盖了操作理解和任务推理,还增强了模型对模糊指令的理解能力。此外,团队引入了思维链标注和数据质量闭环,确保模型训练的有效性和数据的高质量。

在训练策略上,HY-Embodied-0.5-X 采用分阶段迭代的方法,首先通过小规模高质量数据验证训练配置,然后逐步扩展至大规模训练,以提升训练效率和稳定性。该模型在空间理解、长程规划和具身交互方面展现出显著优势,使机器人能够更准确地理解环境并完成复杂任务。

HY-Embodied-0.5-X 的推出标志着腾讯在具身智能领域的又一重要进展,有望在机器人与人类的互动中,推动技术的进一步发展与应用。

划重点:

HY-Embodied-0.5-X 是一款新发布的多模态大模型,专为机器人智能交互优化。

该模型结合多种数据源,提升了机器人在真实环境中的操作理解和执行能力。

分阶段训练策略确保了模型的高效训练和稳定表现,适用于多种家庭和桌面场景。

来源:腾讯推出具身多模态大模型 HY-Embodied-0.5-X,赋能机器人智能交互 | AIbase

声明:本文来自aibase,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/