资讯
百天攻克人形双腿 开源整机成本仅2.5万美元
一支团队在100天内成功开发出人形机器人双腿结构,总成本控制在3万美元以内,并计划通过优化将整机成本降至2.5万美元。该项目采用模块化设计和开源方式,使用商用现货部件和低成本制造工艺,使中小实验室也能轻松复刻。机器人仿生髋关节设计实现类人步态,具备26个自由度和稳定脚踝结构,旨在推动人形机器人技术的普及。
宇树发布UnifoLM-VLA-0大模型 为通用人形机器人赋能物理常识
宇树开源UnifoLM-VLA-0大模型,专为通用人形机器人设计,实现了视觉-语言-动作的深度融合。该模型通过物理常识训练,增强了空间感知与动作序列建模能力,在G1机器人平台上成功完成12类复杂任务,展现了强大的泛化性和鲁棒性,推动具身智能发展。
微软Rho-alpha模型能否引领机器人迈向物理智能?
微软研究院推出首款机器人专属Rho-alpha模型,创新性地将触觉感知纳入核心决策环节,实现自然语言指令到控制信号的端到端转化。该模型通过融合视觉、语言和触觉多模态感知,推动机器人从数字智能迈向物理智能,旨在提升机器人在复杂真实环境中的自主操作能力。
华南理工突破人造肌肉技术 软体机器人驱动迎革新
华南理工大学周奕彤课题组在《Bioinspiration & Biomimetics》发表突破性研究,提出“自诱导大螺旋节距(SLiP)”人造肌肉制造方法。该方法无需预载,单步热处理即可制备出性能卓越的人造肌肉,最大收缩应变达95.1%,拉伸变形高达560%,功率密度为猎豹肌肉的35倍,且在5000次循环测试中性能稳定。研究展示了其在仿生手臂、软体抓手等机器人应用中的巨大潜力,为软体机器人驱动技术带来革命性变革。
MOJANDA 330北斗芯片量产 车规级精度达毫厘
MCT毫厘智能在江苏省北斗产业专场活动中正式发布车规级北斗三频高精度定位芯片MOJANDA 330,该芯片已完成工程验证并具备量产条件,通过AEC-Q100车规认证,旨在为智能驾驶等场景提供稳定可靠的核心器件。文章同时介绍了公司RMS系统级能力矩阵,涵盖芯片、模组、IMU及自研算法,展现了推动北斗技术工程化与规模化应用的产业协同实践。
MiniMax Music 2.5发布 攻克AI音乐控真难题
MiniMax正式发布Music2.5版本,重点攻克AI音乐在可控性与真实度上的核心难题。新版本通过段落级强控制功能,支持14种音乐结构标签,实现精准编曲;同时物理级高保真技术显著提升人声质感与乐器表现,并针对华语市场深度优化,为专业音乐创作提供强大工具。
蚂蚁灵波开源具身大模型LingBot-VLA,后训练代码全面开放,让开源真正可用
蚂蚁集团旗下灵波科技开源具身大模型LingBot-VLA,作为面向真实机器人操作的智能基座,实现了跨本体、跨任务泛化能力,大幅降低后训练成本。在GM-100和RoboTwin2.0评测中刷新成功率纪录,仅需80条演示数据即可高质量迁移任务,推动具身智能规模化落地。
Figure发布迄今最强人形机器人模型,4分钟完成连续复杂任务
Figure公司发布最新人形机器人模型Helix 02,通过单一神经网络实现端到端全身控制,在厨房环境中连续自主执行长达4分钟的复杂任务。该机器人展示了用臀部关抽屉、用脚抬门等自然动作,并借助掌心摄像头和指尖触觉传感器完成拿取药丸、精准注射等精细操作。其创新的分层控制系统(System 0/1/2)实现了从像素输入到全身协调的突破,标志着人形机器人自主能力的重要进展。
腾讯混元图像3.0开源,800亿参数引领AI创作新纪元
腾讯混元团队正式开源全球最强开源图生图模型——混元图像3.0,拥有800亿参数,采用混合专家架构,在LMArena榜单中位列第一梯队。模型通过‘先思考,后编辑’的核心技术,深度融合文本与视觉理解,支持增删改、风格变换、老照片修复等多种编辑功能,适用于从普通用户到专业设计师的广泛场景。
Mistral AI发布Vibe 2.0 终端编程助手进入子代理时代
Mistral AI 发布 Vibe 2.0 终端编程助手,由 Devstral2 模型驱动,核心升级为多代理编排能力。它支持多文件协同和自定义子代理分工协作,显著提升复杂项目开发效率,并新增终端斜杠命令优化操作体验。该版本采用订阅制,提供企业级定制服务,标志着 AI 辅助编程进入高度自动化的代码编排新阶段。
LingBot-VLA引领具身模型从无序走向有序竞争
本文探讨了具身智能领域面临的评测标准缺失问题,指出无序竞争阻碍了技术工程化落地。通过分析上海交通大学发布的GM-100评测基准和蚂蚁LingBot-VLA的表现,文章强调了标准化评测对推动行业有序发展、驱散泡沫质疑的关键作用,为具身模型从乱象走向高质量发展提供了清晰路径。
Mistral AI推出Vibe 2.0编程助手,新增自定义子代理功能
Mistral AI 发布终端编程助手 Vibe 2.0,由 Devstral 2 模型驱动,提供强大的代码编排能力,支持全代码库上下文感知和自定义子代理功能,可分工处理测试、代码审查等任务。新版本优化交互逻辑,增加指令澄清机制和斜杠命令,提升开发效率,现已集成在付费订阅计划中。
北大团队首创电感知SLAM技术 机器人水下不再“睁眼瞎”
北京大学谢广明教授团队在IJRR发表创新研究成果,提出基于电感知的Electro-SLAM系统,为水下机器人在黑暗、浑浊等极端环境下提供全新的定位与建图解决方案。该系统仿生弱电鱼感知机制,结合主动与被动电感知,实现了单机与多机协同的高精度SLAM,显著提升水下自主作业能力。
蚂蚁开源LingBot-Depth模型 提升机器人抓取透明反光物精度
蚂蚁集团旗下灵波科技开源高精度空间感知模型LingBot-Depth,该模型基于奥比中光Gemini330系列双目3D相机,通过创新的掩码深度建模技术,有效解决机器人对透明、反光物体的深度感知难题。在权威评测中性能显著优于主流模型,能大幅提升三维视觉的精准度和可靠性,推动具身智能与机器人技术的发展。
MiniMax M2.1赋能Clawdbot 全天候开源AI助手时代来临
Clawdbot开源AI助手在接入MiniMax M2.1模型后,凭借出色的全栈任务处理能力和极低成本,实现了24小时持续运行的智能工作流。它能自动处理报价比较、邮件跟进、技术监控等复杂任务,并通过聊天软件跨平台控制,预示着未来与工具交互将更多通过编程式智能体完成。