当头部大厂也付不起AI账单,token价格战是市场必然的答案
Meta、Uber、亚马逊等科技巨头近期对员工使用AI模型生成内容的token消耗量施加了严格限制,其核心目标在于遏制日益攀升的成本。此前,这些企业曾积极推动AI技术在全公司范围内的落地应用,其初衷在于借助AI技术来压缩人力开支、抢占产业转型的红利,并期望借此形成一种良性的正向收益循环。然而,现实的演进却与预期相背离,反而催生了巨额的算力开支账单。这种预期与现实的落差,主要源于三重矛盾:一是AI模型调用所消耗的资源总量持续膨胀;二是内部应用过程中存在显著的资源浪费现象;三是当前AI技术的能力本身仍存在局限,尚无法完全兑现其降本增效的承诺。因此,如今头部企业开始收缩其AI应用的规模,这一举措表明,现有的实践并未达到预设的基础设施投入产出标准。从更宏观的视角审视,整条相关产业链都面临着降低成本、提升效率的迫切需求。
近期,以Meta、Uber、亚马逊为代表的多家全球科技巨头不约而同地开始限制其员工运用AI生成内容。这一现象标志着,此前曾被产业界寄予厚望的“token经济”,其成本高昂的一面正逐渐显现。
Uber的案例在这一趋势中表现得尤为典型。该公司最初制定的、计划覆盖整个财年的token(词元)预算额度,在实际执行中仅消耗了四个月便已告罄,由此产生的单个工程师月均人工智能(AI)开销介于500至2000美元之间。为了有效遏制这种成本的无序扩张,Uber方面直接采取了管控措施,明确为每位员工设定了每月1500美元的token使用上限。
根据Meta方面的内部测算,若继续维持当前员工对AI工具的调用增长速度,仅至2026年,公司内部因使用人工智能所产生的支出就将达到数十亿美元规模。为此,Meta已向约6000名核心员工下发了内部备忘录,对全员的token使用配额做出了明确限制。与此同时,亚马逊的高管也公开告诫员工,应避免“为了使用AI而使用AI”的倾向,并将相关的考核指标从token消耗量调整为标准化的业务交付成果。
这些企业此前全力以赴地推动了全员人工智能技术的落地应用,其核心诉求十分明确。其一,借助人工智能来替代那些重复性的人力工作,从而压缩在研发、运营以及客服岗位上的人力开支,并且依赖大模型来自动生成代码、整理数据和撰写方案,以此缩短项目周期。其二,为了抢占人工智能转型的先发红利,通过全员深度使用来积累落地经验,进而探索业务智能化的新模式,从而拉开与同行在数字化方面的差距。其三,基于token单价持续下行的行业趋势,他们认为人工智能的边际成本会持续走低,因此长期投入将能够形成正向的收益循环。
这些企业的激进AI推广目标已经落空了。企业不仅没有成功实现人力成本的缩减,反而增加了一笔难以预估的巨额算力账单,至于大量的token投入能否转化为实际的业务增量,仍有待得到验证。
然而,最初的预期与实际执行的结果之间出现了显著的差异,造成这一局面的核心原因在于三个尚未解决的矛盾。
首先,企业所消耗的token总量呈现出指数级的膨胀趋势,由此构建了一道难以逾越的"成本墙"。公开数据表明,主流大模型token单价相较于2023年初的降幅最高可达98%,但AI智能体等应用需要开展多轮推理以及长文本循环交互,使得企业员工的日均调用量出现了百倍级的增长。单价的持续下跌根本无法抵消总量暴涨所引致的总开支扩张,哪怕单位成本极为微小,在与海量使用规模进行乘算之后,最终形成的总成本也将是一笔天文数字。
其次,企业内部token消耗存在大量非理性浪费。许多仅仅依靠人类自主思考或常规搜索引擎便能迅速得出答案的简单需求,也被员工习惯性地交由大模型处理。大模型的底层推理逻辑决定了,即便是简短的一问一答,也必须经历模型的完整加载与多轮文本生成过程,这使得其单位成本天然就高于人工检索。更为关键的是,部分头部科技企业为抢占人工智能应用红利,将token消耗量直接纳入了正向绩效考核,甚至设立了消耗排行榜。这种单纯以使用频次为导向的考核方式,缺乏对实际产出与效率的有效约束,直接诱发了员工为获取绩效认可而刻意刷高使用量的行为,从而进一步放大了资源的无效消耗。
第三,现阶段AI存在明显的能力局限,企业尚未找到高效的技术落地路径。当前大语言模型难以深度适配细分业务场景,生成内容往往需要员工进行二次核对与修正,员工的角色已从内容生产者转变为内容审核者,企业并未真正实现人力的释放;多数企业对AI的使用仍停留在浅层的文案生成与代码辅助层面,未能搭建完整的业务闭环。即便是Meta与亚马逊这类拥有充足资源的企业,只要投入无法转化为净收益,其商业逻辑便难以成立,集体对token使用量的限制正是市场对此作出的回应。
在当前的人工智能时代,token作为核心生产资源,就如同互联网时代所扮演的网络流量角色,或工业时代所对应的能源角色。其本质要求是实现广泛的普惠性并保持低廉的成本,不应成为企业在运营过程中的主要负担。当前,主要的科技企业鉴于高昂的token账单而主动缩减人工智能应用规模,这一现象表明,当前的人工智能大模型距离成为真正的基础设施标准尚有显著差距。因此,围绕token展开的市场价格竞争也必然会成为一种趋势。最新的动态显示,OpenAI已经启动了大幅度的降价规划,该举措一旦正式实施,其他厂商很可能将采取跟随策略。
实现token价格的持续下降,并不仅仅依赖于大模型厂商单方面的利润让渡,而是依赖于从硬件到算法、从能源到运营的整条产业链共同实现成本的系统性降低。当前,整条产业链都面临着迫切的降本增效需求。从目前的经营状况来看,Anthropic是唯一有望实现季度运营盈利的头部人工智能厂商,其余主要厂商则普遍处于亏损状态。为了持续压低token的定价,除了大模型厂商自身需要不断优化模型架构、压缩推理过程中的算力损耗之外,上游的算力基础设施成本也必须同步下降。这具体包括了图形处理器(GPU)等计算硬件的价格、存储介质的成本,以及数据中心运行所消耗的能源与电力供应价格。只有当整条链路的各项成本都实现同步下探,token才能真正走向廉价与普惠,人工智能技术才具备机会广泛地赋能于千行百业。
封面图片来源:每日经济新闻
来源:每经热评|当头部大厂也付不起AI账单,token“价格战”是市场必然的答案 | 每日经济新闻