华为发布一系列Agentic AI新品 千卡集群每秒吞吐达500万Tokens
《科创板日报》6月5日讯(记者 黄心怡)在今日举行的华为云INSPIRE创想者大会上,华为云对Agentic Infra通智一体化基础设施、新一代模型训推平台以及企业级智能体平台等一系列Agentic AI新品进行了发布。大会还宣布正式上线“行业AI梦工厂”的智慧医疗、具身智能、智能制造以及科学计算四大专区。
▍AICS灵衢智算集群的千卡每秒吞吐达到500万Tokens
其中,AICS灵衢智算集群借助超大带宽灵衢网络,可支撑10万卡级集群规模,总算力高达200EFLOPS,并把Tokens生成时延压缩到10毫秒以内,使千卡每秒吞吐达到500万Tokens,在线服务可用性高达99.95%,从而打造出极致效率的Token工厂。
记者了解到,这一服务是以灵衢网络为基础构建的昇腾950芯片智算集群服务,而千卡每秒吞吐达到500万Tokens这一指标,则对应于基于DeepSeek大模型所实现的服务吞吐量。
此前,DeepSeek曾表示,由于高端算力仍受限制,目前V4-Pro的服务吞吐依然较为有限,预计在下半年昇腾950超节点批量上市后,Pro价格将会大幅下调。
华为公司董事、华为云CEO周跃峰在接受《科创板日报》等媒体采访时表示,华为云始终坚持自主自强的发展路径,以独立自主的算力芯片体系为基础,持续推进国产化进程。
华为公司董事、华为云CEO周跃峰
他提到,算力成本仍是一项重大挑战。“当前大模型普遍已达到万亿参数,且可以预见,明年其参数规模还会进一步提升至2T、3T,甚至10T,也就是10万亿,相应地,构建这类模型所需的算力资源也会成倍增长。不可能让每一家机构和公司都各自建设万卡集群,因此更现实的路径,是由公有云来承载通用大模型,并借助机密推理与训练机制,实现算力资源的高效且安全共享。”

AMS Agentic记忆存储解决方案借助NPU直通CMS上下文记忆存储硬件,构建PB级超大记忆空间,并支持KV Cache分层池化,从而在降低推理成本的同时支持天级长程任务,进而打破Agent的记忆瓶颈;CCE Volcano Next通智一体化调度引擎依赖于“训推共池+碎片整合”来实现通智混合算力负载调度的革新,可以将资源利用率提升30%以上;AgentSphere用于构建Agent运行环境,并借助羽量级沙箱技术成功实现100毫秒级极速启动以及每分钟十万级批创能力。
此外,华为还发布了新一代ModelArtsNext模型训推平台,围绕RL强化学习服务、机密推理、模型路由以及模型矩阵构建了四大能力。其中,MaaS模型路由具备成本优先、效果优先以及均衡模式三种策略,能够依据请求特征动态智能地择优调度最佳模型。截至目前,平台已提供15余款SOTA模型服务,模型调度精准率超过95%,调用成本平均降低20%。
华为云正式启动智果(AgentArts)企业级智能体平台公测,并选用了Harness工程体系。智果开源版openJiuwen也已同步上线。与此同时,华为云发布了全新的Agentic华为云入口“智果园”,可提供Agentic云服务、智能体以及大模型等能力,并将上述能力全面进行Skill化与CLI化,从而完成从意图理解、功能开发、资源发放到应用部署的智能体化,进而提供Tokens服务。
会上,华为云联合智谱、DeepSeek、Minimax、Kimi、阶跃星辰、百度、美团LongCat、讯飞星火、爱诗科技以及生数科技等20余家TOP模型厂商,正式发布了“百模千态,云聚共赢”生态合作计划。
周跃峰表示,希望借助“百模千态”行动计划,进一步提升华为云服务的token效率。未来几年的重点方向将面向智能体,把硅基黑土地以及相关的软件和硬件做好。
▍全球首个全流程具身智能开发平台CloudRobo正式发布
华为云在会上正式发布了行业AI梦工厂的四大专区。其中在智慧医疗专区方面,华为云医疗AI使能平台将于6月30日完成升级并启动公测。华为云智慧病理方案已在全国范围内实现规模化复制,覆盖顶级三甲以及地市级、县域医院。大会现场,上海交通大学医学院附属瑞金医院、邯郸市中心医院、河北工程大学附属医院、瑞安市人民医院、黔西南州兴义市人民医院以及武安市第一人民医院等20余家医院正式入驻智慧医疗专区。
具身智能专区可提供一站式的具身智能数据合成、模型开发以及仿真验证平台,以帮助具身智能企业加快场景落地进程。同时,华为云发布了全球首个全流程具身智能开发平台CloudRobo,可提供PB级数据底座及开发管线、业界首个云原生具身模型生产引擎,以及首个全国产Real-Sim数据生产及模型评测体系,从而帮助机器人实现小时级上云以及模型分钟级部署。该平台将于6月30日公测。
记者在现场看到,新松机器人、乐聚机器人、深朴智能、亿嘉和、凌云光旗下元客视界、上海交大、拓斯达、优艾智合、枢途科技、前海宝安具身智能产业创新中心、国地共建人形机器人创新中心、东北亚具身智能创新中心、广东省具身智能训练场、千寻智能、无锡数据集团、清华大学、自变量、华沿机器人、五八智能以及智身科技等成为首批入驻专区的机构。
本次大会还发布了智能制造专区,可提供一站式工业智能体创新创业环境,从而使工业智能体的创新得以落地;同时发布科学计算专区,面向AI4S行业客户提供统一且丰富的模型、智能体使用体验,进一步助力科研创新。
周跃峰透露,不同于其他云计算厂商,华为云将把重点放在深耕行业应用方面,并会在下半年进一步推出更多专区。
“AI技术为国计民生相关行业带来的生产力提升,正是华为云所坚持的根本目标。华为云并不太关注token总量或收入总量,而是更关注国产化算力系统所产出token背后所带来的价值提升,能否真正匹配各行业需求,并最终实现善政、惠民、兴业的目标。”
周跃峰认为,不能仅以使用量作为衡量token价值的单一标准,而更应关注token在其背后对生产力提升所带来的实际贡献。“以金融行业为例,更值得关注的是其防范了多少金融风险,以及提升了多少信贷业务效率等方面。”
在谈到AI是否存在泡沫这一问题时,周跃峰表示,AI的发展方向必然是正确的,但相关投资需要形成回报,而回报的核心正在于生产力的提升。医疗、金融等行业的数字化进程相对较快,因此也应优先推动这些行业实现进一步发展。
来源:刚刚!华为发布一系列Agentic AI新品 千卡集群每秒吞吐达500万Tokens | 财联社