资讯
蚂蚁灵波开源世界模型LingBot-World-Fast,实现实时交互体验
蚂蚁灵光App上线“体验世界模型”,用户仅需上传一张图片即可在手机端生成60秒3D世界并以第一人称实时漫游。其核心为开源LingBot-World-Fast,480P下达16fps、交互延迟低于1秒,并通过后训练优化提升实时生成效率与时序一致性,支持本地部署与二次开发,面向具身智能、游戏与内容创作。
腾讯推出具身多模态大模型 HY-Embodied-0.5-X,赋能机器人智能交互
腾讯正式推出并开源具身多模态大模型 HY-Embodied-0.5-X,该模型专为机器人智能交互优化。通过 MoT-2B 和 MoE-32B 两种架构,实现了端侧实时响应与复杂任务处理的平衡。模型在空间推理、长程规划及精细操作方面表现优异,结合高质量自采数据与思维链标注,大幅提升了机器人在真实环境中的执行能力,为家庭服务等应用场景提供了强有力的技术支持。
亚毫米级精准对位:小米开源VLA大模型后训练全流程
小米正式开源视觉-语言-动作(VLA)大模型 Xiaomi-Robotics-0 的真机后训练全流程。该模型凭借仅20小时的任务数据训练,即可实现亚毫米级的精准对位,完成耳机收纳等复杂操作。此次全链条开源涵盖模型权重、技术报告及源代码,旨在降低具身智能开发门槛,加速高精度 AI 机器人在生产生活中的应用落地。
国产芯片再突破 5nm龙鹰二号正式发布 AI算力达200TOPS
芯擎科技正式发布自主研发的5纳米车规级AI座舱芯片“龙鹰二号”。该芯片算力高达200TOPS,原生支持7B以上大模型,并采用前瞻性的“柔性架构”实现舱驾融合与物理隔离安全保障。作为国产高端车载芯片的重大突破,它将有效降低整车架构复杂度,加速智能汽车向中央计算时代演进,为国产化算力方案提供强力支撑。
腾讯QClaw迎来大升级:接入DeepSeek-V4-Pro,AI专家能力可“开箱即用”
腾讯云 Agent 平台 QClaw 发布 v0.2.14 重大版本更新,接入 Hermes 框架并支持 DeepSeek-V4-Pro、混元 Hy3、KIMI 等多款顶级大模型。此次升级推出内置超百位行业专家的“专家广场”,实现 AI 能力开箱即用。配合微信小程序的远程管理与语音交互功能,极大降低了用户构建与使用 AI Agent 的门槛,提升办公效率。
小米开源VLA大模型后训练全流程,推动机器人实现亚毫米级操作能力
小米公布并开源VLA大模型Xiaomi-Robotics-0真机后训练全流程,聚焦解决机器人落地“最后一公里”。机器人仅用20小时任务数据强化训练,即实现连续收纳耳机等亚毫米级精细操作,兼顾高精度对位与实时纠偏稳定性,降低高性能机器人任务开发门槛,推动复杂场景应用加速落地。
PNAS:新型软体机器人遇水变形,游泳速度提升780%,可滚动、爬坡并牵引重物
关于PNAS:这种软体机器人会“遇水变形”,游泳速度暴涨780%,还能滚动、爬坡、拉重物的文章
影禾医脉联合北京天坛医院发布全球首个全疾病覆盖颅脑CT辅助报告大模型
首都医科大学附属北京天坛医院与影禾医脉联合发布了全球首个全疾病覆盖的颅脑CT辅助报告大模型“小君医生2.0”。该模型基于海量高质量影像数据及AI Agent技术架构,实现了从影像解析到诊断报告生成的全流程自动化,标志着AI辅助诊断从单纯的病灶识别进化为具备临床思维的报告生成,显著提升了神经影像诊断的精准化与标准化水平。
谷歌DeepMind推出解耦式DiLoCo:优化异步训练架构 可容忍硬件故障
本文介绍谷歌DeepMind推出的解耦式DiLoCo分布式训练架构,该架构通过将训练任务分散到异步计算孤岛,解决传统同步训练易受单点硬件故障影响的问题,可大幅降低跨数据中心带宽需求,具备自愈能力且支持异构硬件协同,有效提升大模型训练效率与鲁棒性。
乒坛的阿尔法狗来了?索尼AI机器人击败职业选手
本文介绍索尼研发的乒乓球AI机器人Ace击败人类职业选手,创下实体竞技运动机器人新里程碑。文章详解其技术架构、比赛表现,同时提及国内人形乒乓球机器人、马拉松人形机器人的相关进展,探讨实体运动AI机器人的技术突破与未来应用潜力。
DeepSeek-V4发布 性能直逼顶级闭源模型 百万上下文定价1元起
关于DeepSeek-V4 发布!性能直逼顶级闭源模型,百万上下文 1 元起的文章
DeepSeek-V4预览版正式发布:1M超长上下文能力面向全员普惠
DeepSeek正式发布并开源DeepSeek-V4预览版,标志着1M超长上下文进入普惠时代。该系列分为Pro与Flash双版本,通过创新的DSA机制大幅降低长文本处理成本。模型在Agent协作、代码生成及逻辑推理性能上表现卓越,支持动态调节思考强度,不仅在性能上直逼顶级闭源模型,更通过技术突破加速了AGI的普及进程。
Soul 开源实时数字人生成模型SoulXFlashTalk 实现亚秒级延迟
本文介绍Soul AI Lab开源业内首个14亿参数实时数字人生成模型SoulXFlashTalk,该模型可实现亚秒级延迟与32帧高帧率,开放相关资源能有效降低行业研发门槛,此举完善了Soul“语音+视觉”双模态开源布局,未来将持续推进开源战略,推动AI与社交等多领域的创新发展。
腾讯发布并开源全新AI大模型混元Hy3 Preview
腾讯于4月23日发布并开源全新大模型混元Hy3 preview,作为混元重建后训练的首个模型,也是当前系列最智能版本。该混合专家模型具备2950亿参数、256K超长上下文,强化复杂推理、指令遵循、代码处理与智能体能力,并已在腾讯云、元宝、QQ等多平台首发,后续将扩展至更多产品以提升智能服务体验。