字节跳动大量采购国产芯片 互联网大厂竞相搭建算力护城河
关于字节跳动数据中心建设的最新进展,业界信息进一步披露,该公司已就采购至少五万颗AI芯片的事项,与芯片制造商天数智芯展开讨论。据知情人士指出,这一大批芯片将主要部署于推理计算场景。
综合多方信息来源获悉,本次正在就芯片供货事宜展开洽谈,相关芯片主要被用于承担大模型的推理计算负载,所对应的产品是天数智芯的智铠系列云端推理GPU,而训练场景则运用其天垓系列。如果此项交易得以达成,那么天数智芯将继华为和寒武纪之后,成为字节跳动的第三家GPU供应商。
在截至当前的时段内,字节跳动与天数智芯这两家公司均尚未对此事作出正式的公开回应。
以字节跳动为代表的互联网大型企业持续加大自建数据中心的投入力度,此举并非旨在短期应急性补充算力缺口,而是从一个侧面反映出产业层面正在发生的深层变革。这一变革具体体现在:人工智能算力需求正迎来结构性的转变,企业对于算力自主可控的战略部署也在持续推进,而训练与推理硬件的分线布局,以及国产算力的规模化替代进程,二者已同步步入落地实施的关键阶段。
近年来,字节跳动在算力投入方面所展现出的动态始终处于持续更新的进程之中。
字节跳动已明确将训练与推理两套芯片供应链进行了完全拆分:在大规模模型训练环节,主要采用华为昇腾以及寒武纪的高端训练卡;而在面向线上C端产品豆包以及企业级MaaS服务的海量并发推理场景中,则引入了天数智芯智铠系列等专用推理GPU来加以支撑。
若本次洽谈最终达成协议,天数智芯将正式加入字节跳动的算力供应体系。其中,华为昇腾主要承担集群训练与超大规模模型的预训练底座任务;寒武纪则同时承担部分中高端推理以及垂直行业的私有化部署工作;天数智芯智铠则专注于线上流量场景下的海量推理主力供给。
除字节跳动外,其他互联网企业亦在积极推进数据中心建设。其中,百度致力于在全国范围内构建万卡级的AI算力集群;阿里巴巴在2026财年单季度资本开支已超过380亿元,并预计未来三年将投入超过3800亿元用于增强云计算及智能计算硬件;与此同时,腾讯则在全国多个地点部署腾讯云HCC高性能AI集群,计划于2026年下半年大规模引入国产算力,并同步对外提供混元大模型MaaS、游戏AIGC以及视频生成推理等服务。
面壁智能AI Infra技术负责人李宇轩在接受第一财经记者采访时进行了分析并指出,互联网大型企业之所以密集构建多供应商算力体系,主要是基于供给确定性、议价能力以及整体成本结构等多方面的考量。在这些企业的算力需求构成当中,用于推理任务的计算体量要远远超过训练任务,并且推理任务对于芯片在互联、显存带宽以及生态成熟度等方面的要求,相较于训练任务而言要低一个台阶。国产芯片在推理侧已经达到了可用的水平,这一现状使得更多供应商能够成为真正可落地的工程选择,而不再是仅仅停留在纸面的战略规划。
与此同时,信创与国产化进程构成了面向政企客户及央国企市场时不可逾越的合规要求。在技术路线层面进行多线并行布局,能够让企业保有选择的技术空间,从而避免被单一厂商的硬件迭代与生态演进节奏所限制。沂景资本董事总经理谢思远分析指出,部分互联网厂商的关键客户来源于国有企业及重要行业,因此在构建算力体系的过程中,它们通常会对国产化能力与信创适配要求给予高度重视。从生态匹配的视角来看,当前互联网大型企业与国产芯片厂商之间依然存在着若干关键的壁垒有待消除,双方的合作关系正处于持续磨合与相互适应的阶段。
清微智能高级副总裁卢强对记者指出,互联网厂商着力推进算力供应链的多元化布局,其核心动因并非单纯的国产替代逻辑,而是源于市场需求、供给环境与供应链安全等多重维度的综合考量与叠加效应。一方面,随着大模型应用走向深入,模型推理任务的需求正呈现出快速增长的态势。另一方面,海外高端芯片的供给由于受到出口管制政策的影响,其稳定性存在不确定因素。在此背景下,企业为确保算力资源的可靠供给,必须着手构建包含多家供应商的备份与协同体系。与此同时,国产芯片在推理应用场景中的性价比优势、交付可控性以及本地化服务能力得到了显著提升,这使其得以从前期的概念验证阶段,顺利迈向规模化的部署应用窗口期。
竞争关键在于“谁的Token成本更低”
站在市场经济逻辑的视角,国内大规模数据中心的投建,本质上是由于下游AI算力真实需求持续释放所带来的市场驱动结果。
曦望Sunrise联席CEO王湛对记者表示,预计至2026年,国内大模型将步入应用爆发期。届时,以DeepSeek V4等模型所引发的海量Token调用需求的激增为代表,以Agent为代表的智能体应用正步入快速普及的阶段。这导致行业竞争的关键进一步聚焦于“谁能提供成本更低的Token”。目前,国产推理芯片在特定场景下的性价比以及单位功耗性能,已经达到了相当可接受的水平。
具体应用场景涵盖了大型企业的高并发推理集群,诸如搜索推荐、智能客服以及短视频多模态生成等场景,同时也包括智能体应用,这些场景每日产生的Token消耗量高达数万亿次,从而成为当前国产推理芯片采购的最大客户群体;另一大主要场景则是大模型头部企业针对MoE架构所进行的常态化训练与微调工作,伴随MoE架构的广泛应用,行业对于算力调度以及局部推理能力的需求呈现出急剧增长的态势。
依据灼识咨询发布的全球AI推理芯片行业报告,当前AI芯片产业正经历一场深刻的结构性转变:其核心驱动力正从以训练为主导的范式,向以推理为核心的应用模式过渡。这一趋势带动了AI推理芯片需求的快速增长。报告预测,至2030年,全球AI推理芯片市场规模将达到30,696亿元人民币;其中,中国市场的规模预计将达到11,664亿元人民币。
刘华,优刻得新兴事业部的副总经理,预测后续在办公场景以及各类业务人工智能化升级等方面的需求预计将保持持续增长的态势,进而对算力资源形成旺盛的需求。他进一步判断,人工智能行业预计在未来三到五年内,仍将持续处于高速发展的阶段。
由于多重因素的共同刺激,推理需求出现了激增,从而引发了暂时的供需失衡。王湛指出,市场出现了“一卡难求”的现象,行业头部企业纷纷疯狂抢购GPU卡、购置内存、租赁数据中心以及扩建推理算力等行为,导致整个供应链承受了压力。今年一季度,算力租赁成本上涨了近30%至40%,预计全年AI推理的算力需求将达到训练需求的4到5倍。
卢强判断,当前供应短缺的现象确实客观存在,且主要集中在高端AI加速卡、高带宽内存(HBM)、先进封装技术以及整机服务器等几个关键环节。从市场现状来看,行业整体的交付周期已被显著延长,热门芯片型号的排产处于紧张状态,同时整机的报价也随着供需关系的变化与内存价格的波动呈现上行趋势。
谢思远进行了预估并指出,下半年随着行业内部竞争的加剧,同质化的现象将日益凸显,市场中的价格竞争将聚焦于Token这一核心领域,由此引发的价格战甚至可能导致整体价格呈现出下降的态势。
国产算力生态追赶中
根据香港理工大学的研究测算,在超大规模云端服务场景中,由于存在“十亿级别”用户的高频访问请求,推理过程所产生的能耗在AI总体能耗中占据了60%至90%的比重。与此同时,中国工程院的数据显示,2026年第一季度,中国对于AI推理的算力需求已达到训练需求的8倍之多。
交银国际研报分析认为,这一结构性变化意味着,对于数据中心运营商而言,支撑大规模推理任务的高密度、低延迟算力需求将会成为增长的主要驱动力。随着国产GPU扩产在即,叠加超大型云厂商订单的滚动释放,预计2026年下半年项目落地节奏将较上半年进一步加快。
预计在今年第二季度,针对新模型的开发工作以及对现有模型的持续迭代,将继续对需求韧性形成有效支撑。与此同时,无论是在企业端还是客户端,对于推理逻辑的需求都在不断提升,这正在成为驱动行业中长期发展的关键力量。那些能够作为即时供应补充的数据中心运营商,则有望凭借自身所掌握的资源优势以及客户粘性,进一步提升其在市场中的份额。
刘华分析认为,尽管短期内面临一定的供应压力,但从中长期视角来看,英伟达的供应压力将促进国产算力产业链的成长。"现阶段国产卡由于产能及适配问题导致供货暂时无法提升,但出货规模将逐步扩大,这呈现为此消彼长的态势",他表示。
受地缘政治因素与出口管制政策的约束,国内相关产业在短期内虽仍需采购英伟达的高端算力芯片作为补充,但具备自主替代能力的国产算力生态已进入了规模化建设与落地应用的阶段。
对于包括字节跳动在内的国内互联网厂商而言,其采取的策略具有阶段性特征:在短期阶段,通过采购芯片的方式来解决当前的算力需求;在中期阶段,则借助于国产的多供应商策略,以降低供应风险并控制成本;而从长期视角来看,依靠自主研发,将利润留存于企业内部。这一策略逻辑与谷歌TPU的发展路径相似,自主研发芯片的核心目的,并非为了对外销售,而是为了尽可能摆脱对外部供应商的依赖,从而避免被动境地。
鉴于大型科技企业内部业务构成多元且应用场景丰富,其对算力资源的需求在模型训练、微调、高并发推理以及图像处理等环节上存在显著差异。构建多供应商体系,使得企业能够运用A芯片执行大规模模型训练,选用B芯片处理长文本推理任务,并借助C芯片支持轻量级边缘计算负载,从而有助于实现整体拥有成本的优化。
谢思远对记者表示,互联网大厂在着手构建多供应商算力体系时,其核心考量因素在于综合性价比。这些企业通常希望以尽可能低的成本,获取更多可用的算力资源。对于互联网大厂而言,无论最终选用哪家供应商的产品,其决策过程都需要回归到对成本、性能以及稳定性的综合比较之上。在当前芯片供给受到一定限制的背景之下,降低对单一供应商的依赖性风险确实是必要的,但这更多是出于一种风险管理的需求。而真正决定各供应商采购规模与采购比例的,仍然是产品在实际部署后所展现出的经济性表现。
相较而言,传统智算中心所扮演的核心角色,更侧重于推动产业培育以及完成基础设施的构建工作。在这一背景下,相较于设施的实际利用效率,其对国产芯片企业营收增长所起到的带动作用,以及对相关产业生态发展的促进作用,被赋予了更高的优先级。与之形成鲜明对比的是,互联网云厂商投身于算力网络的建设,这一行为在本质上归属于市场驱动的商业决策范畴。
在此趋势下,行业正处于一个关键的阶段性节点,即从“可用验证”过渡至“规模使用”。在过去,客户评估的重心往往集中于单卡性能指标;而现在,他们的关注点已显著转向千卡乃至万卡级别集群的整体稳定性与单位算力成本。大规模订单无疑能够直接改善芯片厂商的营收状况、现金流状况以及供应链议价能力,然而,行业的最终格局并不会单纯由一两个重大订单所决定。它仍然会根本性地取决于产品的持续迭代能力、完整的生态构建、可靠的交付体系以及最终的客户复购意愿。从整体算力市场的宏观视角观察,互联网厂商对数据中心进行的大规模投资与布局,仍将被视为产业发展进程中的一个标志性节点。
(文章来源:第一财经)

来源:字节跳动加量采购国产芯片 互联网大厂竞速搭建算力护城河 | 东方财富网