三年蛰伏匿名杀入全球前三,美团龙猫2.0能否改写万亿参数国产算力新叙事?
6月30日,美团发布了新一代万亿参数大模型龙猫2.0,这是国内首个在五万卡国产算力集群上完成全流程训练的模型。此前,该模型的测试版本在调用量方面已位居全球前三。自2023年起,美团便开始聚焦于国产算力的适配工作,并于近期成立了专门的AI转型部门。此外,国产算力支撑大模型训练的成功案例正在不断涌现。专家指出,龙猫2.0的成功因此验证了利用国产算力训练超大模型的可行性,这将有助于推动技术路径的多元化发展以及相关产业的深度融合。
6月30日,美团正式对外发布了新一代基础大模型龙猫2.0(LongCat-2.0)。根据官方披露的信息,该模型是国内首个在五万卡国产算力集群上完成训练与推理全流程的万亿参数大模型。
而此前在四月底,美团龙猫2.0测试版本借助匿名身份“Owl Alpha”接入了全球最大的API路由平台OpenRouter,其截至六月底的总调用量已经达到全球前三的水平。在Hermes、Claude Code这类核心Agent应用场景里,统计数据显示,其月调用量在截至报告期末分别位列全球第一和第二。
一位大模型行业人士在接受《每日经济新闻》记者(以下简称“每经记者”)采访时表示:“在国产芯片上训练出大MoE(混合专家模型)模型仍然是一项非常了不起的成就。”该人士具体指出,国产芯片集群在进行模型训练时,其稳定性表现尚有不足,同时由于缺乏相应的标准算子,往往需要进行额外的专门优化工作,而软件生态的相对匮乏也构成了一个主要的瓶颈,这些因素都会对大模型的训练过程产生显著影响。“而龙猫之所以能够成功实现利用国产算力训练出万亿参数规模的大模型,其主要原因可能在于他们很早就开始尝试并坚持使用国产算力来进行模型训练。”
近半年以来,依托国产算力进行大模型训练的实践案例正不断涌现。例如在2025年4月29日,科大讯飞董事长刘庆峰在公司2025年年报及2026年一季报发布后的财报电话会上,就对行业趋势作出了明确判断。他指出,鉴于中美科技博弈呈现出长期化态势,实现算力的自主可控,已从一项“可选”策略,转变为一项“必选”路径。对于那些已经构建起基于国产算力平台完整模型训练能力的企业而言,它们在响应国家战略需求与开拓政企市场方面,所能够占据的市场空间与发展机遇将愈发显著。
从"能不能用"到"好不好用"的转变,标志着国产算力正在逐步跨越这一初始门槛。然而真正的分界点在于:当关于技术路线的分歧逐渐消退之后,行业竞争的焦点最终还是会回归到最基本的商业考量——哪家的模型能够在真实应用场景当中表现出更高的运行速度、更强的稳定性以及更低的综合成本?
笃定国产算力已逾三年,美团AI业务走向台前
万亿参数大模型与国产算力的组合,在一年前仍被业界广泛视作一项几乎不可能完成的任务。在当时的主流判断中,国产算力卡由于在单卡性能、软件生态以及集群稳定性等关键维度上,与以英伟达为代表的成熟体系存在着代际差距,因此被认为难以胜任前沿大模型繁重的训练需求。而LongCat-2.0这一成果的公开发布,或许正在逐步扭转这种固有认知。
公开信息显示,美团龙猫团队自2023年起便专注于国产算力的适配工作。其发展历程始于千卡规模的集群,并在此过程中逐步攻克了算子适配、通信优化等底层技术难题。
根据官方披露的技术指标,LongCat-2.0的总参数规模达到1.6万亿,采用了MoE混合专家架构,在运行时的平均激活参数约为480亿,并且原生支持1M长度的超长上下文窗口。龙猫团队在五万卡规模的集群上,借助弹性扩缩卡与自动故障恢复等机制,将月均日故障率降低了70%以上;同时通过流水线调度与显存优化策略,使得训练阶段的MFU模型算力利用率提升了1.5倍,稳态日吞吐能力突破1T万亿Tokens词元。
值得注意的是,在过去的两年里,美团首席执行官王兴曾在多个公开场合就人工智能(AI)技术的发展趋势表达过其判断。具体而言,在2025年3月的业绩电话会议上,他明确指出美团的AI策略应遵循“进攻,而非防守”的原则,并阐述道:“当人工智能这样具有革命性的技术出现时,唯一合理的策略不是试图捍卫你现有的商业模式,而是尝试利用你已有的资源来展开进攻。”
2026年3月,王兴进一步向投资者披露了一项重要信息。自2023年初以来,美团在资本支出以及AI人才方面开展了持续的大规模投入工作。据其表述,除拥有云计算业务的企业之外,美团在AI领域的投入规模,在国内企业当中大概率是最大的,且该项布局已经坚持了三年多时间。
在组织架构方面,美团于近期完成了新部门AI Transformation(人工智能转型部)的设立工作。该部门被定位为与外卖以及闪购等核心业务线处于同一组织层级的独立单元,由前大众点评总经理牧遥出任负责人,并向美团核心本地商业CEO王莆中进行工作汇报。此项架构调整表明,人工智能技术在美团的业务版图之中,已经从早期的技术探索阶段演进至了战略核心的位置。
国产算力阵营持续扩围,芯片与模型协同步入关键期
不仅仅是美团,过去半年以来,国产算力在支撑大模型训练方面所取得的案例正密集地涌现出来。产业链中对于降低对英伟达依赖的尝试,已经从个别企业的单一行动逐步演变为整个行业的广泛探索。
美团龙猫团队在其官方微信公众号上坦言,国产算力卡在单卡性能方面虽然仍然落后于世界顶尖水平,但在计算正确性与精度方面已经能够满足大模型训练的需求,在某些局部指标上甚至略有优势。
记者注意到,在今年6月初,深圳河套学院AI训练平台项目团队联合哈尔滨工业大学(深圳)、深圳市大数据研究院以及华为的相关团队,依托于昇腾910C国产AI算力集群,成功完成了1.6万亿参数大模型DeepSeek-V4-Pro的全参数后训练工作。项目期间累计完成了1500多步训练迭代,全程未发生任何中断,最终模型的算力利用率达到了30%以上,并实现了关键训练算子14%的效率提升。对此,深圳市的官方通报评价道,“此次实践印证了国产AI芯片具备支撑世界级超大参数模型训练工作的能力”。
在国产算力支撑大模型训练的这条技术路径上,科大讯飞则树立了一个典型的实践范例。6月9日,讯飞正式发布了星火医疗大模型V3.5,该模型通过基于全国产算力进行训练的方式,成功实现了在医疗领域的多模态理解与处理能力,以及支持更长上下文窗口的重要技术突破。讯飞创始人刘庆峰在公司司庆活动上阐述道,即使在国产算力生态尚处于发展、面临客观挑战的阶段,讯飞从公司成立之初就始终坚持走“全国产大模型训练之路”。他进一步指出,随着国产算力技术的持续突破,模型迭代的周期预计将得到进一步加速,而大模型的训练与推理成本也将随之持续降低。
针对前述现象,天使投资人兼资深人工智能领域专家郭涛在每经新闻的采访中,从四个维度阐述了国产算力生态的战略价值。他指出,在政策层面,国家正出台相关举措鼓励自主创新,并积极支持国产算力生态体系的发展与完善,相关企业对此战略方向的主动响应,有望在产业协同等方面获得潜在支持。从技术自主与安全可控的角度审视,借助国产算力能够有效降低对外部特定算力生态的依赖程度,从而缓解技术封锁风险,为人工智能模型的研发与长期稳定运行奠定安全基础。在成本效益方面,随着国产算力在多个场景中实现规模化应用,其在采购成本与后期运维成本方面的性价比优势正逐步凸显。最后,从构建完整产业生态的视角考虑,国产算力的广泛应用将直接推动国内在算力芯片、计算框架等上下游关键环节的持续技术迭代,最终有望催生一个相互促进、良性循环的国内产业格局。
不过,郭涛也指出在此前国内大厂与大模型企业未能实现万亿参数模型全栈国产化训练的原因所在:其一,技术路线存在差异,部分团队延续使用国外成熟的算力及相关技术体系,在国产算力适配的底层研发方面投入有限;其二,资源与难度存在制约,训练万亿参数规模的模型需要大规模国产算力集群的支撑,且需要攻克硬件故障、通信延迟等特有难题,部分团队受限于算力资源或技术储备而难以推进;此外,对于国产算力的实用性验证需要一个过程,早期对其性能稳定性的顾虑可能会影响投入方面的决心。
郭涛指出,LongCat-2.0的成功发布验证了国产算力支撑大规模模型的可行性,这将激励其他团队加大在国产算力方面的研发投入,并加速行业技术路径的多元化进程。同时,这一进展将推动国产算力与大模型产业之间的深度融合,助力构建一个自主可控的技术体系,从而为行业的长期发展提供更多可能性。
当“全国产”技术路线逐渐从备受质疑的状态,转向获得成功验证的阶段时,那么,中国AI产业的算力叙事,是否真的已经抵达了一个关键的转折点呢?这一问题的答案,很可能将在未来更多企业依赖国产算力所产出的模型性能报告当中,逐步得到清晰的展现。
封面图片来源:每经媒资库
来源:三年蛰伏、匿名冲榜杀进全球前三,美团龙猫2.0能否改写“万亿级”参数模型国产算力新叙事? | 每日经济新闻