剑桥团队推出AI Agent一天生成10000个3D模型并能自主运动

剑桥团队推出AI Agent一天生成10000个3D模型并能自主运动

剑桥大学和牛津大学团队开发的Articraft系统,利用大语言模型直接编写代码生成可活动的3D模型。该系统能在24小时内生成超过1万个模型,覆盖笔记本电脑、无人机等多种类别,通过专用SDK和验证机制实现高效、低成本建模,平均每个模型成本约1.97美元。研究显示其生成质量优于现有方法,并创建了大规模数据集Articraft-10K,用于提升3D物体理解模型的性能。

2026-05-23 20:13
0
0

柔性机械臂从太空拓展至地面,将应用于刚性臂无法到达的场景

柔性机械臂从太空拓展至地面,将应用于刚性臂无法到达的场景

本文首先报道了“驭星三号”卫星搭载的柔性机械臂成功完成太空精密操作,但这并非故事的终点。文章核心深入剖析了这种“绳驱柔性机械臂”的独特技术优势——它能做出刚性机械臂无法完成的复杂弯折与绕障动作。其真正的产业价值,在于将太空验证可靠性后,转向解决地面工业中的“硬骨头”:进入核电站、航空发动机内部等狭小危险空间,执行传统工具和人员难以胜任的极限作业。

2026-05-23 20:06
0
0

WEM:分开世界与自我具身世界模型才能走得更远

WEM:分开世界与自我具身世界模型才能走得更远

本文探讨了具身世界模型在长时序任务中的挑战,指出单流视频生成模型容易导致场景漂移和交互错误。作者提出World-Ego Modeling(WEM)范式,将预测责任拆分为稳定的场景规律(World)和机器人中心的交互动态(Ego)。这种方法能更好地处理导航-操作混合任务,提升模型的场景一致性和动作准确性,为具身智能的发展提供新视角。

2026-05-22 19:14
0
0

HiF-VLA推出以motion为中心的边想边做世界动作模型

HiF-VLA推出以motion为中心的边想边做世界动作模型

本文介绍了HiF-VLA,一个以运动为中心的双向时空推理框架,旨在解决视觉-语言-动作模型在长程任务中的因果混淆问题。通过提取低维Motion向量替代冗余图像输入,该框架实现了高效的时间建模,使机器人能够‘边想边做’,理解物理世界动态。在CALVIN等评测中,HiF-VLA显著超越现有方法,为构建世界动作模型开辟了新路径。

2026-05-22 17:24
0
0

字节跳动开源Lance 3B:实现图像与视频理解与生成

字节跳动开源Lance 3B:实现图像与视频理解与生成

字节跳动开源了Lance 3B模型,这是一个仅30亿参数的轻量级原生统一多模态大模型。它打破了理解模型与生成模型之间的技术壁垒,能同时处理图像和视频的理解、生成与编辑任务。采用Apache2.0协议,训练高效,性能超越更大模型,有望推动AI短剧、智能体等领域的应用发展,降低多模态AI部署成本。

2026-05-22 16:26
76
0

北京人形机器人创新中心发布Pelican-Unified 1.0

北京人形机器人创新中心发布Pelican-Unified 1.0

北京人形机器人创新中心发布Pelican-Unified 1.0,这是一个创新的统一模型,将场景理解、任务推理、未来想象和动作执行整合到一个梯度回路中。通过共享表示z和联合训练,解决了传统独立系统的信息损耗问题,提升了具身智能的效率。实验表明,该模型在多个基准测试中表现出色,推动了机器人技术的发展。

2026-05-22 10:49
0
0

智谱联合清华等提出ZCube组网架构,大模型推理吞吐提升15%,网络成本削减三分之一

智谱联合清华等提出ZCube组网架构,大模型推理吞吐提升15%,网络成本削减三分之一

智谱联合清华大学等在ACM SIGCOMM 2025上提出ZCube网络架构,针对大模型推理中的网络瓶颈。该架构采用扁平化设计,取消Spine层交换机,实现流量负载均衡。在GLM-5.1coding生产环境中,ZCube使GPU推理吞吐提升15%,首Token时延降低40.6%,同时网络成本削减33%。这标志着智算基础设施从通用互联向模型流量驱动的系统协同转变,为大规模AI推理提供了高效经济的解决方案。

2026-05-21 11:45
0
0

腾讯推出操作系统层级AI助手Marvis,支持跨端操控与本地隐私模式

腾讯推出操作系统层级AI助手Marvis,支持跨端操控与本地隐私模式

腾讯推出操作系统层级AI助手Marvis,支持跨端操控和本地隐私模式。Marvis深度理解电脑系统,提供智能文件管理、端云算力切换和多Agent协作,实现一句话操控电脑。具备L2级安全机制,确保敏感操作需用户确认,隐私模式让数据完全本地处理。跨端支持Windows、Mac、iOS、Android,实现可视化远程操控,降低用户门槛,提升效率和隐私保护。

2026-05-21 11:31
87
0

阿里平头哥发布真武M890芯片:性能提升3倍,开启“芯-云-模型-推理”全栈Agent化时代

阿里平头哥发布真武M890芯片:性能提升3倍,开启“芯-云-模型-推理”全栈Agent化时代

阿里云在2026年峰会上发布面向Agentic时代的全栈技术升级,核心是平头哥真武M890芯片,性能跃升3倍,配合超节点服务器和重构的‘千问云’平台,实现从芯片到推理的深度融合。这标志着阿里云从传统云服务转向AI工厂,为智能体提供高效、弹性的基础设施,降低行业AI应用门槛。

2026-05-21 11:30
0
0

表格异常检测将告别one-for-one:OFA-TAD迈向one-for-all通用异常检测新范式

表格异常检测将告别one-for-one:OFA-TAD迈向one-for-all通用异常检测新范式

本文探讨了表格异常检测(TAD)从传统one-for-one(OFO)范式向one-for-all(OFA)通用范式的转变,重点介绍了OFA-TAD新方法。该方法通过将样本表示为邻居距离序列,实现跨领域迁移,无需针对每个新数据集重新训练,从而降低计算成本并提高泛化能力。结合多视角距离编码和MoE自适应融合,OFA-TAD在医疗、金融等领域展示了通用异常检测的潜力。

2026-05-21 11:29
0
0

北理工团队受鱼群多样性启发在Science子刊发表新作让微机器人像鱼群一样各司其职

北理工团队受鱼群多样性启发在Science子刊发表新作让微机器人像鱼群一样各司其职

北京理工大学团队受鱼群形态多样性启发,开发出形态可编码的多软体微机器人系统。通过调整微机器人的身材比例,使其在相同磁场信号下实现差异化响应和选择性控制,模拟鱼群各司其职的协作模式。这一仿生设计简化了多机器人集群的控制复杂性,为生物医疗领域如精准药物递送和微创手术提供了创新解决方案。

机器人大讲堂 2026-05-20 16:36
0
0

南科大、港大与星尘智能合作:FFDC让机器人学会“何时相信想象”,自适应世界模型执行框架推动具身智能发展

南科大、港大与星尘智能合作:FFDC让机器人学会“何时相信想象”,自适应世界模型执行框架推动具身智能发展

本文介绍了南方科技大学、香港大学和星尘智能合作的研究,提出了FFDC-WAM框架,通过未来-现实验证机制让机器人自适应调整动作执行。该框架利用FFDC验证器动态评估预测动作的可信度,从而在保持长时序执行效率的同时,增强对现实偏差的响应能力。实验表明,在RoboTwin基准和真实场景中,FFDC-WAM显著提升了机器人的鲁棒性和效率。

2026-05-20 15:44
19
0

谷歌深夜发布最强模型Gemini 3.5 Flash,速度提升4倍

谷歌深夜发布最强模型Gemini 3.5 Flash,速度提升4倍

谷歌在I/O2026开发者大会上发布Gemini 3.5 Flash模型,速度高达每秒280词元,是GPT-5.5和Claude Opus4.7的4倍。该模型在多项基准测试中超越前代旗舰,性能强劲,并免费向全球用户开放,大幅降低AI应用门槛,助力开发者高效处理长周期任务,成本减半。

2026-05-20 11:27
13
0

视觉大模型评测遇挑战,首个中国古文字OCR基准开源

视觉大模型评测遇挑战,首个中国古文字OCR基准开源

文章介绍了首个完整覆盖中国古文字‘七体之变’的OCR评测基准‘Chronicles-OCR’的开源。该基准由腾讯混元大模型等机构联合多所高校与故宫博物院推出,包含2800张高质量图像,用于评估AI模型识别古文字的能力。评测结果显示,主流视觉大模型在古文字识别上表现不佳,最高准确率仅27.1%,并揭示了模型在微观笔画识别上的短板。这一基准为未来视觉大模型从‘识字’走向‘读史’提供了明确优化方向。

2026-05-19 18:42
58
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 爱力方

https://www.agentren.cn/