资讯
清华大学与星尘智能团队CLAP框架使机器人能从视频中学习技能
清华大学和星尘智能团队开发的CLAP框架,通过对比学习将人类视频中的视觉动作与机器人物理动作空间对齐,使机器人能够从海量视频中学习技能。该框架解决了传统方法数据采集成本高、泛化差的问题,利用ActVAE和VDVAE两个自编码器处理不同模态数据,建立跨模态对齐桥梁,提升了机器人的学习效率和泛化能力。
港大与复旦联手推出TAMEn实现亚毫米触觉操控与100%复现解决双手机器人数据采集难题
香港大学与复旦大学等机构联合推出TAMEn触觉感知操纵引擎,针对双手机器人在柔性物体抓取、精密装配等高接触任务中的数据采集难题。TAMEn通过视觉-触觉闭环系统,实现亚毫米级精度和100%数据复现率,支持双模式硬件切换和在线可行性校验,有效解决了精度与便携性矛盾、硬件适配难、数据清洗耗时等问题,为机器人策略学习提供高质量数据。
蚂蚁百灵发布万亿级思考模型 Ring-2.6-1T,支持推理强度自定义
蚂蚁百灵近日发布万亿级思考模型Ring-2.6-1T,专为Agent工作流、工程开发及科研分析等复杂生产环境打造。该模型核心引入可调节的Reasoning Effort机制,提供high与xhigh两种推理强度模式,旨在平衡推理能力与资源消耗,解决成本与效率难题。评测中high模式在PinchBench获得87.60分,超越竞品;xhigh模式在AIME26和GPQA Diamond上表现优异,推动AI智能体企业级落地。模型已上线免费体验并计划开源,标志大模型竞争转向推理效能精细化。
商汤科技推出 SenseNova 6.7 Flash-Lite,消耗大幅降低 60%
商汤科技近日发布了 SenseNova 6.7 Flash-Lite,一款轻量化多模态智能体模型。该模型采用创新架构,取消视觉转中间层,实现参数量更小、能力更强,在权威基准测试中取得 SOTA 成绩。Token 消耗相比传统模型降低60%,支持毫秒级反馈,满足高频互动需求。模型已应用于金融、制造、医疗和教育等多个行业,具备行动决策、工具链编排等五大核心能力。商汤科技还提供限时免费使用计划和开源技能,助力开发者快速上手。
机器人成功复刻膝跳反射 人类最快神经回路首次在仿生腿上跑通
德国斯图加特大学的研究团队成功在仿生腿上复现了人类的膝跳反射,这是人体最快的单突触神经回路。他们使用气动人工肌肉和传感器,严格按照人体解剖数据构建机械腿,并通过实验验证了机器人的反射行为与人类一致。这项研究证明了将生物反射回路移植到物理硬件上是可行的,为机器人控制和仿生学提供了新思路。
Genesis AI 单模型实现打蛋弹琴,机器人界迎来ChatGPT时刻
Genesis AI 近日发布了首个机器人基础模型 GENE-26.5,该模型能自主完成打蛋、解魔方、弹钢琴等多种高难度任务,无需人工干预,标志着通用机器人技术在处理非结构化任务上的实质性突破。凭借全栈自研和快速训练能力,项目获得1.05亿美元种子轮融资,预示机器人技术可能很快进入真实世界应用。
腾讯发布OpenSearch-VL开源多模态深度搜索智能体综合方案
腾讯混元联合多机构发布了OpenSearch-VL,这是一个完全开源的多模态深度搜索智能体方案。通过强化学习技术,它创新性地开发了数据生产线、多元化工具环境和故障感知算法,解决了高质量训练数据缺失的瓶颈,使模型能主动搜索和推理。实验表明,OpenSearch-VL在多项基准测试中表现优异,媲美顶级商业模型,并全量开源以推动多模态AI研究的发展。
苏黎世联邦理工学院让机器人学会"想象":零样本部署四足和人形机器人
ETH苏黎世研究团队开发了RWM(Robotic World Model)框架,通过神经网络模拟器让机器人在虚拟环境中“想象”动作,实现零样本部署到真实硬件。该框架采用双重自回归机制解决误差累积问题,使用GRU架构提高预测效率,并结合特权信息训练策略。实验表明,ANYmal D四足机器人和Unitree G1人形机器人能精确执行速度跟踪任务,无需在线微调,显著提升了机器人学习的样本效率和部署安全性。
削皮、切片、探测表面,瑞士团队用扩散场让机器人学会操作曲面物体
瑞士洛桑联邦理工学院团队提出'扩散方向场'方法,利用点云数据和扩散方程为机器人创建平滑的局部坐标系,解决曲面物体操作难题。该方法能实时处理变形物体,集成到遥操作、轨迹规划和强化学习中,提升任务效率和鲁棒性,为机器人处理复杂曲面提供通用解决方案。
Inworld AI 推出实时 TTS-2:一款适应用户交流方式的闭环语音模型
Inworld AI 推出了实时 TTS-2,这是一款创新的闭环语音模型,能够实时捕捉用户的语调、节奏和情感状态,提供更自然的对话体验。通过闭环系统架构,TTS-2 不仅将文本转换为音频,还能理解上下文和情感变化,支持跨语言一致性和灵活的语音设计。该模型通过语音指令、对话意识等功能,提升了语音AI的连贯性和真实感,旨在在竞争市场中脱颖而出。
交互感知连续体机器人,哈工大团队首创微创内耳手术新范式——获登Nature子刊
哈工大团队研发交互感知连续体机器人系统(DS-MDCR),首创经自然腔道的微创内耳手术新范式。该系统通过双段连续体机构、内窥镜和力感知微针协同,在狭窄耳道内实现精准药物注射和采样,突破传统手术创伤大的局限。成果发表于《自然·通讯》,为内耳疾病治疗开辟精准干预新路径,有望推动治疗模式升级和早期干预发展。
全球27国526支战队参与巅峰竞技,AGIBOT WORLD CHALLENGE @ ICRA 2026线上赛成绩揭晓
AGIBOT WORLD CHALLENGE @ICRA 2026线上赛成绩公布,吸引全球27国及地区526支队伍参赛。赛事首创“推理—操作”与“世界模型”双赛道,并通过真机数据、仿真平台与标准化评测体系,推动具身智能与机器人世界模型评测标准走向国际化。
帕西尼1个月发布3款触觉传感器,再度展现全球具身感知龙头姿态
文章聚焦帕西尼在1个月内连续发布3款触觉/力觉传感器,重点介绍超薄SLIM系列在1mm厚度、400点/c㎡测力密度、多维感知等方面的突破,并解析其以硬件、数据、模型协同构建具身感知生态与行业护城河的战略价值。
无需人类遥控,机器狗仅靠“看”和“学”通过模仿动物实现敏捷奔跑新突破发表于《Nature Communications》
文章介绍南京大学团队发表于《Nature Communications》的四足机器人研究:机器狗通过模仿真实狗的运动数据学习自然步态,并结合纯视觉感知与分层神经网络控制,在陌生随机障碍赛场中实现自主判断、跑跳切换和高成功率通关,展示了生物启发机器人控制的新进展。