资讯
《Science Robotics》重磅:科学家让机器人学会削皮,实现复杂曲面通用任务迁移
本文介绍了发表在《Science Robotics》上的一项前沿研究:科学家提出“扩散方向场”方法,攻克了机器人在复杂曲面上执行任务的难题。该技术通过将任务动作与物体几何形状解耦,使机器人能像人类一样在不同形状的物体(如香蕉、梨等)上实现通用的技能迁移。这一突破极大地提升了机器人在非规则表面操作时的灵活性与鲁棒性,是机器人通用技能学习领域的重要里程碑。
腾讯混元重建后首次发布并开源Hy3 Preview:主打全面实用性,Agent能力大幅提升
关于混元重建后首发并开源 Hy3 preview:主打全面实用性,Agent能力大幅提升的文章
腾讯发布最新开源语言模型 Hy3 Preview,聚焦智能时代应用趋势
腾讯正式发布混元系列最新开源模型 Hy3 Preview,总参数量达295亿并支持256K超长上下文。该模型在复杂推理、指令遵循和代码处理等核心能力上显著提升,已广泛应用于元宝、QQ、腾讯文档等产品。此外,腾讯云同步推出了极具竞争力的API价格体系和定制化套餐,旨在通过高性能、高性价比的AI方案,助力开发者和企业在多样化场景下实现智能化升级。
超越VLA与世界模型:解析GEN-1、Being-H0.7与π0.7的架构演进与共性路径
本文深入解析了2026年涌现的具身原生模型新浪潮,重点探讨了GEN-1、Being-H0.7、π0.7及GR00T N1.7等前沿架构的进化。文章指出,具身智能正摆脱传统VLA与世界模型的局限,通过UMI设备、人类第一视角视频等原生数据实现规模化增长。通过对比隐式空间对齐与显式多模态调节等不同路径,揭示了行业在异构数据处理与物理世界理解上的突破,标志着具身智能正式进入原生时代。
机器人数据困局怎么破?一文拆解Sharpa全栈数采布局
本文深入拆解了Sharpa公司在机器人灵巧操作领域的数据采集布局。针对高自由度机器人面临的数据采集难题,文章重点介绍了Sharpa如何通过DexEMG技术利用表面肌电信号(sEMG)实现高效的闭环遥操作。通过对63个自由度的精准控制与系统性解法分析,文章揭示了Sharpa如何突破传统仿真与数采的瓶颈,为具身智能实现高质量示教数据规模化生产提供了前瞻性的技术路径。
自变量WALL-B以世界统一模型架构解锁进入家庭能力
本文深入探讨了自变量机器人推出的新一代具身智能基础模型WALL-B。该模型摒弃了传统的VLA架构,采用全球首创的世界统一模型架构(WUM),实现了视觉、语言与动作的原生多模态融合。通过重构底层逻辑,WALL-B赋予机器人如同人类般的“下意识”行为能力与原生本体感,使其能深度理解物理规律并实现跨场景能力迁移。这一技术突破标志着具身智能正从表象模仿走向本质理解,为机器人真正走进家庭生活奠定了坚实基础。
阿里通义千问正式开源Qwen3.6-27B,编程能力实现“以小博大”表现
阿里云正式开源270亿参数模型Qwen3.6-27B,其编程能力实现跨级飞跃,在多项基准测试中超越了15倍规模的MoE模型。该模型原生支持图像、视频等多模态输入,并深度适配主流编程助手与开发者工作流。通过降低部署门槛与提升推理效率,Qwen3.6-27B旨在为开发者提供更精准的编码辅助与视觉推理体验。
小米MiMo-V2.5启动公测:4.3小时手搓编译器,长程智能体能力实现“满分”突破
本文介绍小米MiMo-V2.5系列大模型开启公测的相关信息,涵盖其Pro版本在编译器开发、长程智能任务上的顶尖性能表现,全模态能力、Token效率优势,平台配套的计费优惠政策,以及模型后续即将开源的规划,展现小米在AI大模型领域的快速迭代实力。
小米发布MiMo-V2.5大模型系列,正式开启公测
本文介绍小米于4月23日发布的MiMo-V2.5系列大模型,该系列包含四款模型,核心版本面向全球开源。其中Pro版支持百万级Token上下文,长复杂任务能力媲美顶尖闭源模型;标准版全模态能力优异且API成本降低50%,配套升级的计费方案也进一步降低开发者使用门槛。
Science子刊发表“运动学智能”,有望破解机器人换机需重头教技能难题
针对机器人“演示学习”中技能难以跨平台迁移的痛点,Science Robotics近日发表了关于“运动学智能”的研究。该研究通过对机器人关节空间奇异点的拓扑分析,将物理约束转化为内部控制逻辑,使机器人能深刻“认识”自身结构。这一方案实现了技能在不同型号、不同自由度设备间的无缝迁移,为机器人快速部署提供了可解释的安全框架。
Tacchi 2.0发布:低计算成本的视觉触觉动态接触仿真器
Tacchi 2.0是由方斌教授与张建伟院士团队研发的低成本视觉触觉动态仿真器。它通过结合物质点法(MPM)与相机模型,实现了从物理形变到图像生成的完整链路,支持按压、滑动与旋转等动态接触模拟。该仿真器在分类与滑动检测任务中展现了出色的Sim-to-Real零样本迁移能力,有效解决了高质量触觉数据获取难的瓶颈,可作为插件集成于各类机器人仿真平台。
智源发布业内首个开源世界模型与VLA框架VISTA
本文围绕智源联合多校提出的开源“世界模型+VLA”框架VISTA,解析其如何通过“视觉subgoal+文本子任务”的分层协同,突破传统端到端VLA在OOD场景中的泛化瓶颈。文章对比π0.7技术路径,并结合真机实验展示VISTA以少量数据实现高成功率的关键价值与落地意义。
自变量机器人发布全球首个世界统一模型,35天后新一代机器人入驻真实家庭
自变量机器人发布基于世界统一模型(WUM)的具身智能基础模型WALL-B,突破传统VLA架构在信息损耗与泛化能力上的瓶颈。文章聚焦其原生多模态融合、物理规律理解与家庭场景落地路径,并宣布35天后新一代机器人将入驻真实家庭,推动机器人从“演示智能”迈向“可用智能”。
月之暗面正式发布 Kimi K2.6 模型,多项指标对标全球顶尖大模型
月之暗面正式发布旗舰大模型Kimi K2.6,在编程能力、长程任务及多Agent协作方面实现显著跨越。该模型在多项权威基准测试中表现优异,多项指标对标全球顶尖模型。K2.6不仅支持Mac本地化部署并大幅提升推理效率,其创新的Agent集群架构更支持多达300个智能体并行作业,能高效完成从深度搜索到全链路内容生成的复杂任务。
全球首个肌肉驱动机器人成功实现Sim-to-Real迁移并完成真实环境验证
文章深入探讨了全球首个肌肉驱动机器人成功实现Sim-to-Real迁移的里程碑式成果。针对气动肌肉与肌腱传动中极端复杂的非线性动力学难题,研究团队提出广义执行器网络(GeAN),抛弃传统扭矩传感器,仅凭位置轨迹即可精准建模。该技术在四自由度机械臂上完成了高难度动态任务的零样本部署,填补了柔性机器人从仿真到现实的核心技术空白,为未来安全高效的人机共融机器人发展奠定了坚实基础。