英伟达Cosmos生态与机器人布局逻辑解读:物理AI的范式跃迁

英伟达Cosmos生态与机器人布局逻辑解读:物理AI的范式跃迁

文章深入解读英伟达在物理AI领域的战略布局,重点分析Cosmos生态作为物理世界操作系统的核心角色。Cosmos 3融合混合Transformer架构,从视觉语言模型演进到世界动作模型,构建感知、生成与验证的闭环。同时探讨了数据鸿沟的现实挑战及英伟达通过Omniverse与Cosmos协同解决的策略,展示了其在机器人和自动驾驶时代构建全栈生态的雄心。

2026-06-05 14:52
0
0

Ideogram4.0开源发布:93亿参数打造最强文字生成AI,DesignArena全球第四

Ideogram4.0开源发布:93亿参数打造最强文字生成AI,DesignArena全球第四

Ideogram4.0是Ideogram开源发布的文生图模型,拥有93亿参数,采用单流架构提升文本与视觉协同生成能力。其核心优势在于卓越的文字渲染和设计可控性,能准确生成长文本并精确控制布局,在DesignArena全球榜单中排名第四,适用于海报设计、品牌营销等视觉内容创作场景。

2026-06-05 11:20
53
0

具身智能落地关键:EtherCAT IgH 开源主站

具身智能落地关键:EtherCAT IgH 开源主站

本文探讨了具身智能机器人成功落地的关键,强调底层控制系统的重要性。重点分析EtherCAT通信协议在多关节机器人同步控制中的优势,以及IgH EtherCAT Master作为开源主站的实现和应用。文章解释了主站在协调机器人动作中的作用,提供了IgH配置和使用要点,帮助开发者优化系统性能,避免误判工程问题。

2026-06-04 17:20
0
0

扩散模型让宇树机器人随实时音乐生成身体动作

扩散模型让宇树机器人随实时音乐生成身体动作

本文介绍了DiscoForcing系统,它利用扩散模型将实时音乐流转换为机器人身体动作,解决了传统离线方法的延迟和稳定性问题。通过因果音频编码、动作潜空间压缩和流式生成,该系统能够在机器人乐队场景中实现低延迟、同步的动作控制,展示了具身智能在实时交互中的潜力和应用价值。

2026-06-04 17:18
0
0

原生多模态 LongCat-Next 开源发布,让视觉和语音成为 AI 的母语

原生多模态 LongCat-Next 开源发布,让视觉和语音成为 AI 的母语

本文报道了原生多模态大模型LongCat-Next的重磅开源发布。该模型采用创新的DiNA架构,将视觉、语音和文字统一为离散Token,使AI能像处理文字一样原生理解和感知物理世界。通过dNaViT技术实现高保真图像处理,在多项测试中超越现有模型,展示了强大的跨模态协同能力和语言性能,标志着AI向原生多模态的革新,推动技术落地。

2026-06-04 16:21
0
0

谷歌发布Gemma 4 12B模型,支持16GB内存本地即时响应,采用无编码器架构

谷歌发布Gemma 4 12B模型,支持16GB内存本地即时响应,采用无编码器架构

谷歌发布Gemma 4 12B多模态模型,采用颠覆性“无编码器”架构,彻底取消传统编码器组件,大幅降低模型复杂度和内存需求。该模型仅需16GB内存即可在消费级硬件上本地部署和即时响应,性能接近更大规模模型。作为开源项目,它支持多种推理框架,推动本地AI应用的普及,引发社区热议。

2026-06-04 15:57
0
0

苹果 Mac 16GB 内存版本本地运行谷歌 Gemma 4 旗舰模型

苹果 Mac 16GB 内存版本本地运行谷歌 Gemma 4 旗舰模型

谷歌 AI Edge Gallery 正式登陆苹果 macOS 系统,允许 Mac 用户无需联网即可本地运行 Gemma 系列 AI 模型。离线运行不仅大幅提升响应速度,还确保数据隐私绝对安全。重点模型 Gemma-4-12B-it 仅需 16GB 内存,便能流畅处理文本、视觉和音频等多模态任务,并具备代码编写能力。同时推出的 Google AI Edge Eloquent 应用提供离线语音转写,支持自定义词汇库,所有处理均在设备本地完成,为用户带来高效、私密的智能体验。

2026-06-04 15:56
0
0

LoongForge 全链路优化 GR00T N1.6 训练,训练周期减半,吞吐提升至 2.3 倍

LoongForge 全链路优化 GR00T N1.6 训练,训练周期减半,吞吐提升至 2.3 倍

文章介绍了百度百舸LoongForge框架如何通过全链路系统优化,解决GR00T N1.6 VLA模型训练中的IO阻塞、通信开销大和调度低效等问题。优化措施包括异步数据Prefetch、通信-计算重叠和CUDA Graph调度,最终实现训练吞吐提升2.3倍,训练周期缩短56.6%,显著降低了训练成本,加速了具身智能模型的迭代进程。

机器人大讲堂 2026-06-03 19:13
89
0

谷歌发布Gemma 4,E2B架构让手机本地运行AI实现质变

谷歌发布Gemma 4,E2B架构让手机本地运行AI实现质变

谷歌发布开源大模型Gemma 4,其创新的E2B架构通过参数卸载技术大幅降低显存需求,使高达300亿参数的模型能在手机等端侧设备本地高效运行。该架构将有效参数减少到仅需2GB显存,突破了移动设备的AI部署瓶颈,支持离线AI应用如本地代码编写,提升数据隐私。Gemma 4还具备多语言和多模态能力,未来有望在智能手机上实现高性能AI体验,推动下一代消费级应用变革。

2026-06-03 14:53
0
0

字节跳动开源统一框架 Bernini,提升 AI 视频编辑可靠性

字节跳动开源统一框架 Bernini,提升 AI 视频编辑可靠性

字节跳动开源了统一AI视频生成与编辑框架Bernini,通过“先理解、再生成”协同机制,将工作流拆分为语义规划与视觉渲染,解决传统AI视频编辑中的画面失控、帧间闪烁等痛点。该框架支持文本、图片和视频输入,实现精准语义控制,如改变天气、动作和镜头,并引入SA-3D RoPE位置编码技术提升多片段串联稳定性。测试中表现卓越,部分代码已开源,为AI视频编辑带来更高准确性和可控性。

2026-06-03 14:08
10
0

智元开源行业首个世界模型专属具身数据集,让机器人通过多样交互理解真实世界

智元开源行业首个世界模型专属具身数据集,让机器人通过多样交互理解真实世界

智元开源了行业首个专属于世界模型的具身数据集AGIBOT WORLD 2026第二期,主题为'多样交互'。该数据集系统记录机器人与真实物理世界间复杂、高密度、非理想的交互过程,包括成功与失败案例,旨在补齐世界模型训练中长期缺失的真实物理交互数据。通过开放下载,智元推动研究者探索物理规律,加速世界模型和具身智能的发展,让机器人从学习任务转向理解真实世界。

2026-06-03 13:37
0
0

腾讯云大模型全面降价,最高降幅达97.5%,与官方原厂价持平

腾讯云大模型全面降价,最高降幅达97.5%,与官方原厂价持平

腾讯云智能体开发平台宣布自6月3日起对DeepSeek V4系列大模型进行大幅降价,最高降幅达97.5%。主力模型DeepSeek-V4-Pro推理价格降75%,缓存命中价格降97.5%;DeepSeek-V4-Flash缓存降90%。此举旨在降低企业与开发者AI应用成本,推动创新,并与DeepSeek官方降价持平,加剧云计算市场竞争,促进AI技术普及。

2026-06-02 18:09
0
0

清华AIR开源UniLab:人形机器人运控训练3分钟完成,速度提升10倍且兼容Mac

清华AIR开源UniLab:人形机器人运控训练3分钟完成,速度提升10倍且兼容Mac

清华大学AIR DISCOVER Lab推出新一代机器人强化学习训练架构UniLab,采用创新的CPU高效仿真与GPU策略训练异构架构,大幅提升训练效率。在多项机器人运控任务中,UniLab实现3-10倍端到端加速,如3分钟内训好人形机器人,速度提升10倍,并支持跨平台运行,包括Mac本地训练,推动机器人民用化和智能训练进入'分钟级'时代。

2026-06-02 16:42
0
0

越疆发布空弈大模型,国产具身智能标准任务成功率超99%

越疆发布空弈大模型,国产具身智能标准任务成功率超99%

越疆公司近日发布了自主研发的‘空弈DobotWAM’具身大模型,标志着国产具身智能技术的重大突破。该模型在LIBERO标准评测中成功通过四项任务套件,综合平均成功率达99.25%,在空间关系理解、物体泛化、目标指令和长时序任务执行方面表现卓越。这一技术成果验证了模型的高稳定性和精准度,有望为机器人行业的商业应用提供强有力的底层支撑。

2026-06-02 14:34
0
0

特斯拉新专利解决头顶烤箱痛点:定点抽取天幕区域高温空气

特斯拉新专利解决头顶烤箱痛点:定点抽取天幕区域高温空气

特斯拉发布了一项新专利,针对电动车玻璃车顶导致的“头顶烤箱”高温痛点,提出抽吸式空调系统方案。该系统通过在天幕区域定点抽取高温空气,直接送入空调处理,有效降低座舱温差,提升温度均匀性和乘坐舒适性。同时,这一设计能减少空调能耗,避免对续航的显著影响,并为现有车型提供了低成本升级的可能性,展现了特斯拉在智能热管理技术上的创新。

2026-06-02 10:32
0
0

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 爱力方

https://www.agentren.cn/