资讯

剑桥团队推出AI Agent一天生成10000个3D模型并能自主运动

剑桥大学和牛津大学团队开发的Articraft系统，利用大语言模型直接编写代码生成可活动的3D模型。该系统能在24小时内生成超过1万个模型，覆盖笔记本电脑、无人机等多种类别，通过专用SDK和验证机制实现高效、低成本建模，平均每个模型成本约1.97美元。研究显示其生成质量优于现有方法，并创建了大规模数据集Articraft-10K，用于提升3D物体理解模型的性能。

机器人大讲堂

2026-05-23 20:13

柔性机械臂从太空拓展至地面，将应用于刚性臂无法到达的场景

本文首先报道了“驭星三号”卫星搭载的柔性机械臂成功完成太空精密操作，但这并非故事的终点。文章核心深入剖析了这种“绳驱柔性机械臂”的独特技术优势——它能做出刚性机械臂无法完成的复杂弯折与绕障动作。其真正的产业价值，在于将太空验证可靠性后，转向解决地面工业中的“硬骨头”：进入核电站、航空发动机内部等狭小危险空间，执行传统工具和人员难以胜任的极限作业。

机器人大讲堂

2026-05-23 20:06

WEM：分开世界与自我具身世界模型才能走得更远

本文探讨了具身世界模型在长时序任务中的挑战，指出单流视频生成模型容易导致场景漂移和交互错误。作者提出World-Ego Modeling（WEM）范式，将预测责任拆分为稳定的场景规律（World）和机器人中心的交互动态（Ego）。这种方法能更好地处理导航-操作混合任务，提升模型的场景一致性和动作准确性，为具身智能的发展提供新视角。

具身研习社

2026-05-22 19:14

HiF-VLA推出以motion为中心的边想边做世界动作模型

本文介绍了HiF-VLA，一个以运动为中心的双向时空推理框架，旨在解决视觉-语言-动作模型在长程任务中的因果混淆问题。通过提取低维Motion向量替代冗余图像输入，该框架实现了高效的时间建模，使机器人能够‘边想边做’，理解物理世界动态。在CALVIN等评测中，HiF-VLA显著超越现有方法，为构建世界动作模型开辟了新路径。

具身研习社

2026-05-22 17:24

字节跳动开源Lance 3B：实现图像与视频理解与生成

字节跳动开源了Lance 3B模型，这是一个仅30亿参数的轻量级原生统一多模态大模型。它打破了理解模型与生成模型之间的技术壁垒，能同时处理图像和视频的理解、生成与编辑任务。采用Apache2.0协议，训练高效，性能超越更大模型，有望推动AI短剧、智能体等领域的应用发展，降低多模态AI部署成本。

aibase

2026-05-22 16:26

北京人形机器人创新中心发布Pelican-Unified 1.0

北京人形机器人创新中心发布Pelican-Unified 1.0，这是一个创新的统一模型，将场景理解、任务推理、未来想象和动作执行整合到一个梯度回路中。通过共享表示z和联合训练，解决了传统独立系统的信息损耗问题，提升了具身智能的效率。实验表明，该模型在多个基准测试中表现出色，推动了机器人技术的发展。

具身研习社

2026-05-22 10:49

智谱联合清华等提出ZCube组网架构，大模型推理吞吐提升15%，网络成本削减三分之一

智谱联合清华大学等在ACM SIGCOMM 2025上提出ZCube网络架构，针对大模型推理中的网络瓶颈。该架构采用扁平化设计，取消Spine层交换机，实现流量负载均衡。在GLM-5.1coding生产环境中，ZCube使GPU推理吞吐提升15%，首Token时延降低40.6%，同时网络成本削减33%。这标志着智算基础设施从通用互联向模型流量驱动的系统协同转变，为大规模AI推理提供了高效经济的解决方案。

aibase

2026-05-21 11:45

腾讯推出操作系统层级AI助手Marvis，支持跨端操控与本地隐私模式

腾讯推出操作系统层级AI助手Marvis，支持跨端操控和本地隐私模式。Marvis深度理解电脑系统，提供智能文件管理、端云算力切换和多Agent协作，实现一句话操控电脑。具备L2级安全机制，确保敏感操作需用户确认，隐私模式让数据完全本地处理。跨端支持Windows、Mac、iOS、Android，实现可视化远程操控，降低用户门槛，提升效率和隐私保护。

aibase

2026-05-21 11:31

阿里平头哥发布真武M890芯片：性能提升3倍，开启“芯-云-模型-推理”全栈Agent化时代

阿里云在2026年峰会上发布面向Agentic时代的全栈技术升级，核心是平头哥真武M890芯片，性能跃升3倍，配合超节点服务器和重构的‘千问云’平台，实现从芯片到推理的深度融合。这标志着阿里云从传统云服务转向AI工厂，为智能体提供高效、弹性的基础设施，降低行业AI应用门槛。

aibase

2026-05-21 11:30

表格异常检测将告别one-for-one：OFA-TAD迈向one-for-all通用异常检测新范式

本文探讨了表格异常检测（TAD）从传统one-for-one（OFO）范式向one-for-all（OFA）通用范式的转变，重点介绍了OFA-TAD新方法。该方法通过将样本表示为邻居距离序列，实现跨领域迁移，无需针对每个新数据集重新训练，从而降低计算成本并提高泛化能力。结合多视角距离编码和MoE自适应融合，OFA-TAD在医疗、金融等领域展示了通用异常检测的潜力。

具身研习社

2026-05-21 11:29

北理工团队受鱼群多样性启发在Science子刊发表新作让微机器人像鱼群一样各司其职

北京理工大学团队受鱼群形态多样性启发，开发出形态可编码的多软体微机器人系统。通过调整微机器人的身材比例，使其在相同磁场信号下实现差异化响应和选择性控制，模拟鱼群各司其职的协作模式。这一仿生设计简化了多机器人集群的控制复杂性，为生物医疗领域如精准药物递送和微创手术提供了创新解决方案。

机器人大讲堂

2026-05-20 16:36

南科大、港大与星尘智能合作：FFDC让机器人学会“何时相信想象”，自适应世界模型执行框架推动具身智能发展

本文介绍了南方科技大学、香港大学和星尘智能合作的研究，提出了FFDC-WAM框架，通过未来-现实验证机制让机器人自适应调整动作执行。该框架利用FFDC验证器动态评估预测动作的可信度，从而在保持长时序执行效率的同时，增强对现实偏差的响应能力。实验表明，在RoboTwin基准和真实场景中，FFDC-WAM显著提升了机器人的鲁棒性和效率。

具身研习社

2026-05-20 15:44

谷歌深夜发布最强模型Gemini 3.5 Flash，速度提升4倍

谷歌在I/O2026开发者大会上发布Gemini 3.5 Flash模型，速度高达每秒280词元，是GPT-5.5和Claude Opus4.7的4倍。该模型在多项基准测试中超越前代旗舰，性能强劲，并免费向全球用户开放，大幅降低AI应用门槛，助力开发者高效处理长周期任务，成本减半。

aibase

2026-05-20 11:27

视觉大模型评测遇挑战，首个中国古文字OCR基准开源

文章介绍了首个完整覆盖中国古文字‘七体之变’的OCR评测基准‘Chronicles-OCR’的开源。该基准由腾讯混元大模型等机构联合多所高校与故宫博物院推出，包含2800张高质量图像，用于评估AI模型识别古文字的能力。评测结果显示，主流视觉大模型在古文字识别上表现不佳，最高准确率仅27.1%，并揭示了模型在微观笔画识别上的短板。这一基准为未来视觉大模型从‘识字’走向‘读史’提供了明确优化方向。

aibase

2026-05-19 18:42

1 ...8 9 10 11 12 ... 20

通知

尊敬的用户

user

资讯

人文赋能AI技术革新，赵佳音打造精细化人机互动全新架构

剑桥团队推出AI Agent一天生成10000个3D模型并能自主运动

柔性机械臂从太空拓展至地面，将应用于刚性臂无法到达的场景

WEM：分开世界与自我具身世界模型才能走得更远

HiF-VLA推出以motion为中心的边想边做世界动作模型

字节跳动开源Lance 3B：实现图像与视频理解与生成

北京人形机器人创新中心发布Pelican-Unified 1.0

智谱联合清华等提出ZCube组网架构，大模型推理吞吐提升15%，网络成本削减三分之一

腾讯推出操作系统层级AI助手Marvis，支持跨端操控与本地隐私模式

阿里平头哥发布真武M890芯片：性能提升3倍，开启“芯-云-模型-推理”全栈Agent化时代

表格异常检测将告别one-for-one：OFA-TAD迈向one-for-all通用异常检测新范式

北理工团队受鱼群多样性启发在Science子刊发表新作让微机器人像鱼群一样各司其职

南科大、港大与星尘智能合作：FFDC让机器人学会“何时相信想象”，自适应世界模型执行框架推动具身智能发展

谷歌深夜发布最强模型Gemini 3.5 Flash，速度提升4倍

视觉大模型评测遇挑战，首个中国古文字OCR基准开源

快讯

人民锐评：AI脸看腻了？“活人感”该回来了

“无产品供货给英伟达”情况不属实？9天6板公司紧急澄清：未向英伟达供货，市值超160亿元，去年归母净利润2.22亿元

AI时代金融App价值判断新转向：什么样的金融App才真正好用？

DeepSeek发表重磅论文，提出两项互补机制，大模型推理最高提速85%

OpenAI发布新模型，定价较低，但目前仅向美国本土少数可信合作伙伴开放

兰州大学一教师论文图表被指含AI生成水印，涉事期刊声明已启动调查

启元机器人亮相央视，消费级具身智能首登顶级体育赛事

报告梳理2025年法治建设成效，专家：AI赋能须警惕“数字鸿沟”

银河证券：锚定AI高景气赛道，把握顺周期复苏与出海新机遇

浙商证券：市场分化继续，非银板块突起，AI方向继续持有，券商板块可逢低关注

推荐专栏

爱力方

机器人大讲堂