资讯

Genesis AI 单模型实现打蛋弹琴，机器人界迎来ChatGPT时刻

Genesis AI 近日发布了首个机器人基础模型 GENE-26.5，该模型能自主完成打蛋、解魔方、弹钢琴等多种高难度任务，无需人工干预，标志着通用机器人技术在处理非结构化任务上的实质性突破。凭借全栈自研和快速训练能力，项目获得1.05亿美元种子轮融资，预示机器人技术可能很快进入真实世界应用。

aibase

2026-05-07 18:45

腾讯发布OpenSearch-VL开源多模态深度搜索智能体综合方案

腾讯混元联合多机构发布了OpenSearch-VL，这是一个完全开源的多模态深度搜索智能体方案。通过强化学习技术，它创新性地开发了数据生产线、多元化工具环境和故障感知算法，解决了高质量训练数据缺失的瓶颈，使模型能主动搜索和推理。实验表明，OpenSearch-VL在多项基准测试中表现优异，媲美顶级商业模型，并全量开源以推动多模态AI研究的发展。

aibase

2026-05-07 14:54

苏黎世联邦理工学院让机器人学会"想象"：零样本部署四足和人形机器人

ETH苏黎世研究团队开发了RWM（Robotic World Model）框架，通过神经网络模拟器让机器人在虚拟环境中“想象”动作，实现零样本部署到真实硬件。该框架采用双重自回归机制解决误差累积问题，使用GRU架构提高预测效率，并结合特权信息训练策略。实验表明，ANYmal D四足机器人和Unitree G1人形机器人能精确执行速度跟踪任务，无需在线微调，显著提升了机器人学习的样本效率和部署安全性。

机器人大讲堂

2026-05-06 21:36

削皮、切片、探测表面，瑞士团队用扩散场让机器人学会操作曲面物体

瑞士洛桑联邦理工学院团队提出'扩散方向场'方法，利用点云数据和扩散方程为机器人创建平滑的局部坐标系，解决曲面物体操作难题。该方法能实时处理变形物体，集成到遥操作、轨迹规划和强化学习中，提升任务效率和鲁棒性，为机器人处理复杂曲面提供通用解决方案。

机器人大讲堂

2026-05-06 21:36

Inworld AI 推出实时 TTS-2：一款适应用户交流方式的闭环语音模型

Inworld AI 推出了实时 TTS-2，这是一款创新的闭环语音模型，能够实时捕捉用户的语调、节奏和情感状态，提供更自然的对话体验。通过闭环系统架构，TTS-2 不仅将文本转换为音频，还能理解上下文和情感变化，支持跨语言一致性和灵活的语音设计。该模型通过语音指令、对话意识等功能，提升了语音AI的连贯性和真实感，旨在在竞争市场中脱颖而出。

aibase

2026-05-06 16:07

交互感知连续体机器人，哈工大团队首创微创内耳手术新范式——获登Nature子刊

哈工大团队研发交互感知连续体机器人系统（DS-MDCR），首创经自然腔道的微创内耳手术新范式。该系统通过双段连续体机构、内窥镜和力感知微针协同，在狭窄耳道内实现精准药物注射和采样，突破传统手术创伤大的局限。成果发表于《自然·通讯》，为内耳疾病治疗开辟精准干预新路径，有望推动治疗模式升级和早期干预发展。

机器人大讲堂

2026-05-02 12:41