当头部大厂也付不起AI账单,token“价格战”是市场必然的答案
曾一度被产业界寄予了极高期望的“token经济”,如今却演变为令企业成本骤增的“token刺客”。正是由于这一转变,诸如Meta、Uber、亚马逊等全球范围内的科技巨头近期不约而同地为员工运用AI的行为采取了限制性措施。
Uber的案例在众多采取限制措施的企业中,具有最高的代表性。其最初规划的、旨在覆盖整个财政年度的token(词元)预算,在投入运行后仅仅四个月的时间内,预算就被完全耗尽了,单个工程师平均每月的AI(人工智能)使用开销,达到了500至2000美元的范围。为了对成本的快速攀升进行有效遏制,Uber公司直接设置了每位员工每月1500美元的token使用上限。
根据Meta公司内部进行的测算数据表明,如果继续维持目前员工对AI服务的调用增长速度,那么到了2026年,仅仅是内部运用AI这一项支出就会达到数十亿美元的规模。为此,公司向6000名核心员工发放了内部备忘录,并进一步明确了全员的token配额限制。
同样地,亚马逊的高级管理人员也公开告诫员工,不应“为了使用AI而使用AI”。公司的考核指标已经从关注token的消耗量,切换为评估标准化的业务交付成果。
这些企业此前之所以全力推进人工智能在全员范围内的落地应用,其背后的核心诉求是明确的。首先,企业期望借助AI技术来替代那些重复性高的人力工作,从而降低研发、运营以及客服等岗位的人力成本支出。这主要依赖于大模型自动生成代码、系统化整理数据以及撰写各类方案的能力,以此来缩短项目的整体周期。其次,企业意在把握人工智能转型的先发优势。通过促使全员深入使用相关工具,企业能够积累宝贵的落地实践经验,探索业务智能化的新模式,并借此拉大自身与同行在数字化能力上的差距。再者,基于对token单价持续下行这一行业趋势的判断,企业普遍认为AI应用的边际成本将不断降低,从而形成一个长期投入与正向收益相互促进的循环。
由此不难看出,这些企业在人工智能应用推广方面所设定的激进目标已经落空。企业非但未能实现预期中的人力成本缩减,反而新增了一笔规模难以准确预估的巨额算力账单,而前期投入的大量token资源能否有效转化为实际的业务增量,目前仍然有待验证。
而预期与现实之间发生了严重的背离,探究其根源,可以发现主要集中体现在三个矛盾上。
第一,企业的消耗量呈现出指数级膨胀的态势,这导致形成了一道难以逾越的“成本墙”。公开数据显示,主流大模型token单价较2023年初的降幅最高可达98%;然而,AI智能体等应用依赖于多轮推理以及长文本循环交互,使得企业员工的日均调用量增长了百倍。因此,单价的下跌无法抵消总量暴涨所带来的总开支,即便是微小的单位成本,在乘以海量的使用规模之后,最终总成本也将达到天文数字。
第二,企业内部存在严重的、系统性的token资源浪费。其具体表现为,那些原本依靠员工自身认知与快速信息检索即可解决的简单问题,被普遍性地提交给了大模型处理。这源于大模型的底层推理机制:即便是处理最简单的交互,系统也需执行完整的模型加载与多轮文本生成流程,其计算成本在本质上就高于传统的人工检索。此外,头部科技企业为争夺人工智能应用的先发优势,曾将token消耗量设为正向考核指标,并建立了消耗排行榜;该考核体系仅关注使用频次,而缺乏对实际产出质量与效率提升的有效约束。这直接导致部分员工为获取绩效认可而刻意提升token使用量,从而进一步加剧了资源浪费。
第三,现阶段人工智能技术存在明显的能力局限,企业尚未找到高效的落地路径。当前阶段大模型仍无法深度适配细分业务场景,其产出内容常需要员工进行二次核对与修正,员工的角色实质上从内容生产者转变为了审核者,企业并未因此真正实现人力的有效解放;多数企业对AI的使用也仅停留在浅层文案生成与代码辅助层面,未能搭建完整的AI业务闭环。即使Meta、亚马逊这类巨头拥有海量的资金支持,只要投入无法创造净收益,就失去了商业逻辑的合理性。集体限制token使用量,正是市场给出的回应。
Token,作为驱动人工智能时代发展的核心资源,其战略地位类似于互联网时代的网络流量与工业时代的能源供给。这类关键的生产要素,其普及与应用的前提必须是价格低廉且可广泛负担,从而不应构成企业日常运营的主要成本构成。然而,当前头部科技企业因不堪重负的Token账单而主动采取收缩AI使用规模的策略,这一现象有力地表明,AI大模型在当前阶段远未达到成熟基础设施所应具备的可靠性与经济性。可以预见,围绕Token的成本优化与价格竞争,也必然会成为接下来的发展焦点。最新的动态是,OpenAI已启动一项大幅降低价格的规划,一旦该方案正式实施,其他大模型厂商很可能被迫跟进,从而触发一轮全面的价格调整。
token价格的下调不能仅仅依赖于大模型厂商单方面所采取的让利行为,整条产业链都必须同步实现成本的降低。就当前情况而言,唯一有希望达成季度运营盈利的头部AI厂商是Anthropic,而其余厂商则普遍处于财务亏损的状态。为了持续压低token定价,除了大模型厂商需要对架构进行持续优化并压缩推理算力损耗之外,上游的GPU(图形处理器)、存储等硬件价格,机房的能源消耗以及电力价格都必须同步实现下降。只有当整条链路的成本同步实现下调,token才能走向价格低廉且广泛普及的状态,人工智能(AI)才有机会真正为各行各业赋予实际的能力。
免责声明:本文所述内容与提供之数据仅能作为参考资料使用,并不构成任何形式的投资建议,读者在使用前需要自行核实相关信息的真实性与准确性。若依据本文内容采取任何行动,相关风险需由读者自行承担。
每经评论员| 杜恒峰
编辑 | 金冥羽 李雨冰
校对| 何小桃
|每日经济新闻 nbdnews 原创文章|

本声明未经许可,禁止任何形式的转载、摘编、复制及镜像等使用。
来源:当头部大厂也付不起AI账单,token“价格战”是市场必然的答案 | 每经热评 | 每日经济新闻