字节跳动加大量采购国产芯片,互联网大厂竞速搭建算力护城河

2026年06月18日 14:59
本文共计4370个字,预计阅读时长15分钟。
来源/中国能源网 责编/PixelHunter 像素猎人

关于字节跳动数据中心建设的最新进展,行业内部消息人士指出,字节跳动目前正在与天数智芯就采购至少5万颗AI芯片事宜展开讨论,这些芯片将主要应用于推理任务。

据记者多方获取的信息显示,本次字节跳动所洽谈的芯片供货,其主要用途是应对大模型的推理计算负载。该需求对应的是天数智芯旗下智铠系列的云端推理GPU产品,而在训练场景方面则使用天垓系列GPU。如果这笔交易最终得以达成,那么天数智芯将会成为继华为与寒武纪之后,为字节跳动提供GPU算力的第三家供应商。

截至发稿时,字节跳动与天数智芯双方均未就相关事宜发表正式回应。

以字节跳动为代表的互联网大厂加码自建数据中心,这并非短期应急以补充算力缺口,而是折射产业深层变革:AI算力需求迎来结构性切换、企业算力自主可控战略持续升级,训推硬件分线布局与国产算力规模化替代同步进入落地周期。

近年来,字节跳动在算力领域的投入布局持续得到更新。

字节跳动明确了训练与推理芯片供应链完全拆分的策略:大规模模型训练任务,选用华为昇腾、寒武纪的高端训练卡;而线上面向C端的豆包应用以及企业MaaS服务所涉及的海量并发推理需求,则引入了天数智芯智铠系列等专用推理GPU。

如果本次合作洽谈最终达成,那么天数智芯将得以正式加入字节跳动的算力供应体系之中。在这一新的供应格局中,华为昇腾主要负责支撑集群训练任务以及超大规模模型的预训练基础架构;寒武纪则承担了部分中高端推理计算以及垂直行业私有化部署的算力需求;而天数智芯的智铠系列芯片,将侧重于作为线上流量场景下海量推理任务的核心供给来源。

除字节跳动以外,包括百度、阿里巴巴与腾讯在内的其他互联网头部企业,亦均在数据中心的基础设施层面展开了密集的布局与投资。这其中涵盖了百度规划于全国范围内部署万卡级的AI算力集群;阿里巴巴于2026财年实现了单季度超过380亿元人民币的资本开支,据估算其未来三年将投入超过3800亿元,以进一步加注于云计算与智能计算硬件;腾讯则在多地建设其腾讯云HCC高性能AI集群,计划在2026年下半年开始大规模引入国产化算力产品,并同步对外提供基于混元大模型的MaaS服务、游戏AIGC以及视频生成推理服务。

面壁智能AI Infra技术负责人李宇轩对第一财经记者进行分析时指出,互联网大厂之所以密集构建多供应商算力体系,主要基于对供给确定性、议价权与成本结构的考量。在大厂的算力需求中,推理的体量远远大于训练,而推理对芯片的要求,包括互联、显存带宽以及生态成熟度,都比训练低一个台阶。国产芯片在推理侧已经达到可用水平,这使得更多供应商得以成为能够落地的工程选择,而不仅仅是纸面战略。

与此同时,对于面向政企及央企客户的业务而言,信创国产化已构成一项必须满足的硬性合规要求。在此背景下,采用多条技术路线进行并行布局,能够使企业在算力架构上具备更高的灵活性与选择余地,从而避免被单一硬件供应商的产品或其生态迭代节奏所限制。沂景资本董事总经理谢思远指出,鉴于部分互联网厂商的重要客户群体来自国有企业及关键行业,其在构建自身算力体系的过程中,通常会对国产化能力与信创适配性提出更为严格的要求。从生态匹配的角度审视,当前互联网大厂与国产芯片供应商之间仍然存在若干亟待跨越的壁垒,双方的合作关系仍处于持续磨合与动态调整的阶段。

清微智能高级副总裁卢强在受访时指出,互联网厂商着力推进算力供应链的多元化布局,其动因并非局限于单一的国产替代考量,而是由市场需求、供应能力以及供应链安全等多重维度共同叠加所驱动。随着大模型推理需求的快速增长,加之海外高端芯片的供给因出口管制政策而面临不确定性,企业有必要建立起多供应商协作体系。与此同时,国产芯片在推理场景下的性价比、交付可控性与本地化服务能力已得到显著提升,使其从概念验证阶段迈入规模化部署的窗口期。

竞争关键在于“谁的Token成本更低”

从市场经济逻辑的视角出发,国内大规模数据中心的投建行为,其本质实际上是下游AI算力真实需求持续释放所带来的市场驱动结果。

曦望Sunrise联席CEO王湛对记者表示,至2026年,国内大模型已真正步入了广泛应用的爆发期。以DeepSeek V4等模型为引领,其所带动的Token交易市场迎来了爆发式增长,同时Agent技术也得以快速普及。这一系列变化使得行业竞争的关键已转变为如何实现更低的Token成本。目前,国产推理芯片在特定的应用场景下,其性价比与每瓦性能已展现出不错的表现。

具体的应用场景涵盖了互联网大厂用于服务搜索推荐、智能客服、短视频多模态生成等高并发场景的推理集群,以及各类智能体(Agent)应用。这些场景每天能够处理并产生数万亿级别的Token交互与消耗,构成了当前国产推理芯片在市场采购中最主要的需求来源。另一个核心应用场景则聚焦于大模型头部企业所进行的、基于混合专家(MoE)架构的常态化模型训练与微调任务。随着该架构在业界的普及应用,整个行业对于算力的精细化调度以及局部推理能力的需求呈现出急剧增长的态势。

根据灼识咨询发布的全球AI推理芯片行业报告,AI芯片行业当前正在经历一场根本性的范式转变,其核心计算重心正从以训练为主转向以推理为主。在这一趋势下,市场对于AI推理芯片的需求正急剧增长,这一增长是由生成式AI应用的广泛落地所直接驱动的。报告预测,到2030年,全球AI推理芯片行业的市场规模将达到30696亿元人民币;其中,中国市场的规模预计将贡献11664亿元人民币。

优刻得新兴事业部副总经理刘华对此做出了判断,他认为接下来在办公场景以及各类业务的AI化转型方面,相关需求预计将持续增长,从而推动算力需求保持旺盛状态。其中AI行业在未来的三至五年内,预计仍将处于高速发展期。

推理需求在多重因素的刺激下呈现出激增态势,从而引发了暂时的供需失衡局面。王湛指出,市场中出现了“一卡难求”的现象,行业头部企业纷纷疯狂抢购GPU卡、采购内存、租赁数据中心以及扩建推理算力等,这使得整个供应链承受了巨大压力。在今年第一季度,算力租赁成本上涨了近30%至40%,并且预计全年AI推理的算力需求将达到训练需求的4-5倍。

卢强经过判断后指出,短缺现象客观存在,特别是在高端AI加速卡、HBM、先进封装以及整机服务器等关键环节。目前,行业内的交付周期有所拉长,热门型号的排产工作变得紧张,并且整机的报价会随着供需关系以及内存价格的波动而呈现上行趋势。

谢思远就此做出预估,认为在下半年,伴随着行业竞争态势的进一步加剧,产品与服务同质化现象的加剧将变得更为显著。在这一背景下,以Token领域为中心的价格战将出现并愈演愈烈,从而使得整体市场的价格水平反而可能呈现出下行趋势。

国产算力生态追赶中

依据香港理工大学针对能耗问题所开展的研究推算,在超大规模云端部署环境中,由于面临着来自十亿级别用户的高频次请求负载,推理环节所产生的能耗已经占据到AI系统总能耗的大约60%至90%。与此同时,中国工程院方面指出,截至2026年第一季度,中国境内AI推理的需求量已经达到了训练需求量的约8倍之多。

交银国际的研报分析指出,这种结构性变化表明,数据中心运营商将需要满足支撑大规模推理任务的算力需求,即对高密度、低延迟算力的需求将成为主要的增长动力。考虑到国产GPU扩产在即,以及超大型云厂商订单的持续释放,预计到2026年下半年,相关项目的推进节奏将较上半年有所加快。

预计在今年第二季度,由新模型开发和存量模型迭代所引发的算力需求,将持续对市场形成有效支撑。与此同时,企业与客户端在推理环节的具体逻辑需求正变得日益复杂和精细,这一趋势正逐步演变为推动算力产业中长期增长的核心动力。在此背景下,那些能够作为即时算力供应补充的数据中心运营商,有望凭借其掌握的基础设施资源与建立的客户合作关系,进一步巩固并提升自身的市场份额。

刘华判断指出,尽管现阶段英伟达的供应体系给行业带来了显著压力,但从长远视角审视,这种压力反而会成为驱动国产算力实现成长的关键动力。他进一步解释称,现阶段国产芯片由于产能爬坡与生态适配方面的原因,在交付环节暂时出现不足,然而其供给能力会逐步进入放量的阶段。在他看来,这是一个国产算力与外部供应之间相互博弈、此消彼长的动态演进过程。

在地缘性出口管制政策的约束之下,尽管国内相关产业在短期内仍然需要进行采购,将英伟达的高端算力作为必要的补充,但具备技术替代能力的国产算力生态系统,目前已经进入了规模化建设与实际落地的阶段。

包括字节跳动在内的国内互联网厂商,其算力获取策略呈现阶段性特征:短期内依赖外部采购以满足需求,中期通过国产多供应商体系来降低风险与成本,长期则依靠自研芯片将利润留存于内部。这一逻辑与谷歌TPU相似,自研芯片的核心目的并非对外销售,而是尽可能摆脱被动地位。

在训练、精调、高并发推理以及图像处理等多样化业务场景中,对算力的具体需求呈现出显著差异。多供应商的算力供给体系,则允许企业将A类芯片专门部署于大规模模型训练任务,选用B类芯片来承载长文本推理工作,并借助C类芯片处理轻量级的边缘计算需求,从而有助于在整体上实现总拥有成本(TCO)的优化目标。

谢思远在接受记者采访时指出,互联网大厂在构建多供应商算力体系过程中,核心的考量因素在于性价比。这些企业本质上希望能够以尽可能低的成本来获取更多的可用算力资源。对于互联网大厂来说,无论选用哪家供应商的产品,最终都必须回归到对成本、性能以及稳定性的综合评估之上。在当前供给受限的背景之下,降低对单一厂商的依赖风险是必要的举措,然而这更多地体现为一种风险管理方面的需求。真正决定采购规模以及采购比例的关键因素,仍然是在实际部署之后所表现出的经济性。

相较而言,传统智算中心所承担的功能定位更着重于产业培育以及基础设施建设,相比之下,实际使用率并非核心考量指标,带动国产芯片企业营收增长与整体产业发展则显得更为重要;与此同时,互联网云厂商开展算力网络建设工作,其本质上属于市场化运营行为。

在此趋势推动下,当前行业正处在从“功能验证”迈向“规模化应用”的关键过渡阶段。在评估重心上,客户过去往往侧重于单张芯片的性能指标,而如今则更关注由成千上万张芯片构成的集群的整体稳定性,以及由此带来的单位算力成本。这类大额订单的落地,无疑会显著改善相关芯片厂商的营收状况、现金流健康度及其在供应链中的话语权。然而,行业的长期格局并非由一两个孤立的订单所决定,其最终走向仍取决于芯片产品的持续迭代能力、软件生态的完善程度、可靠的交付体系以及终端客户的复购意愿。从整个算力市场的宏观视角观察,互联网头部企业进行大规模数据中心的建设与部署,仍然是推动本轮产业演进的一个核心节点。

来源:字节跳动加量采购国产芯片,互联网大厂竞速搭建算力护城河 | 中国能源网

声明:本文来自中国能源网,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/