Token成为AI产业核心计量单位,成本优化成为落地关键

2026年06月18日 15:39
本文共计2974个字,预计阅读时长10分钟。
来源/财联社 责编/huazi56 爱力方

财联社6月18日讯(记者 郭松峤) 国家信息中心信息化和产业发展部主任单志广在人工智能+生态大会(AIEC 2026)上指出,人工智能技术的发展重心正从前期的模型训练阶段全面过渡至实际推理阶段。他进一步解释,其中应用规模最直接的量化体现,即Token调用量所呈现的指数级增长态势。

本届大会的主办方为清华大学全球产业研究院,并得到了中关村科学城管委会的支持。会议汇聚了来自国家信息中心、IDC、阿里云、腾讯、月之暗面、浪潮信息、美的、上海人工智能实验室、阶跃星辰、百川智能等知名机构与领先企业的专家代表,针对“人工智能+”从战略部署迈向产业实践这一核心议题展开了深入研讨。

超级周期到来,推动中国AI进入规模应用临界点

国家信息中心信息化和产业发展部主任单志广在主论坛上发表观点时指出,Token已超越作为大模型处理文本的基础技术单位范畴,转而发展为连接电力供应、算力资源、模型服务以及应用价值等多环节的新型经济单元。这一转变正推动人工智能基础设施的评价标准,从以往单纯追求算力峰值性能,逐步转向综合考量单位能效、成本效益以及具体场景下的服务支撑能力。

image

单志广进一步指出,得益于算力与能源基础设施、多元化的产业应用场景以及活跃的开放生态等综合优势,伴随着“人工智能+”行动的持续深入推进,中国有望率先完成从人工智能技术突破到规模化商业落地的关键跨越,并由此构建起全链条的产业竞争优势。

image

IDC中国区总裁霍锦洁则基于全球产业趋势的角度进一步指出,全球人工智能产业正在进入一个自互联网浪潮以来最为强劲的IT增长超级周期。本轮增长并非仅仅是单一技术的扩张,而是由AI算力建设和应用落地两方面同步驱动:一端表现为数据中心、GPU等基础设施的持续扩张,以支撑大规模推理需求;另一端则体现为企业AI应用从试验阶段走向生产阶段,智能体开始跨系统地调用数据、规则、API以及工作流,从而推动企业软件从“人的操作界面”转向“智能体可调用的业务能力集合”。

IDC进行了相关预测,指出到2029年,中国生成式AI的市场规模有望逼近千亿美元规模。在此期间,其复合年增长率将高达68%,这使得中国跻身于全球最为活跃的AI应用市场之列。

然而,当AI技术从试验阶段迈向生产环境时,其真正的挑战并不在于技术本身,而在于组织层面。浪潮信息的董事长彭震在其主题演讲中明确指出,AI产业革命不仅改变了工具的使用方式,更重新定义了'劳动者'的概念。随着智能Agent逐渐成为企业生产力的关键组成部分,AI原生转型的重点正在从提升个人效率转向促进组织整体进化。当智能体被部署到生产系统中之后,企业所面临的挑战不再局限于某个具体流程的效率提升,而是如何有效地管理、调度和治理一种新型的数字化劳动者。

基于这一变化,彭震提出了Human+Agent(Humagent)组织概念,这一概念指的是企业从管理Human进化到管理Humagent。他认为,企业应当将智能体正式纳入组织管理体系,从而推动管理对象从传统的人、财、物扩展到人、数字员工、数据以及智能能力等方面。通过重新定义岗位、角色、权限、责任边界和绩效评价,企业可以最大限度地释放AI的智力贡献,并同时保障运营的稳健、高效与低成本。

彭震着重指出,Humagent概念的提出,目的在于帮助企业打破将AI仅仅视为辅助工具的传统认知局限,从而切实将Agent整合进组织运营的核心体系之中。在这一框架之下,企业的终极目标不仅限于追求Agent所能提供的智力成果,更在于着手构建拥有自主进化能力的AI原生组织。他进一步展望,随着人类智慧与机器智能走向深度融合,二者将共同定义一种更具韧性、更富创造力的商业文明新形态。

算力服务正加速向Token服务转型

人工智能的竞争焦点,正从大模型从训练向部署全面过渡所带来的推理需求激增,演进至 Token 服务能力体系的系统性构建,并进一步加速企业级应用的规模化落地。这一转变清晰地表明,行业竞争已不再局限于单一模型在特定任务上的性能表现,而是正在演变为对涵盖算力、数据、模型、应用与商业模式的完整生态体系的综合能力较量。

“智算中心与Token服务”主题分论坛于同期同步举行。九章云极、积算科技、并行科技、昆仑万维、太初元碁以及提尔科技等企业的技术负责人齐聚一堂,围绕Token服务的商业化实践路径、多元算力的落地应用以及智能体(Agent)的规模化部署等关键议题,展开了深入而系统的探讨。

随着人工智能代理(AI Agent)出现规模性增长,全球范围内的Token调用量持续快速攀升,推动算力服务加速向Token服务进行转型。在对此趋势进行阐释时,国家信息中心信息化和产业发展部主任单志广指出,人工智能技术的发展重心已经从前期的大规模模型训练阶段,全面过渡至实际推理阶段。他进一步解释道,这一转型在应用层面最直接的量化体现,正是Token调用量所呈现的指数级增长态势。

九章云极首席科学家缪旭指出,随着智能体任务的复杂性与持续时间不断增加,其对上下文窗口的占用以及所产生的Token调用成本均会急剧攀升。因此,企业在规划与部署长时间运行的智能体时,需要将运行效率与投资回报率(ROI)作为核心考量要素。

他提出了“自进化的Token工厂”这一概念,该模型借助于强化学习与模型蒸馏技术手段,在保证输出质量不受影响的前提下,动态地选取最优的模型路径,据该模型测算,此方案有望将Token成本降低70%以上。

积算科技首席架构工程师郑彬玙就构建企业级Token工厂的相关实践进行了分享。在演讲中他指出,企业在构建此类设施时,普遍面临着模型适配、性能指标达成以及运维管理等多方面的挑战。积算科技借助于其自有的算力资源池和一套统一的API接口,有效地帮助用户应对了模型选型与部署过程中的难题,从而使得Token服务的统一管理以及相关的成本管控工作得以实现。

并行科技MaaS业务技术总监梁奇元指出了目前Token市场中所存在的若干问题,其中包括API质量不稳定、定价体系不透明以及供给渠道较为混杂等现象。并行科技借助其MaaS平台,实现了算力资源与服务的直接对接、计费规则的完全透明化以及请求的智能化路由调度,旨在帮助企业有效应对模型选择困难与服务供给碎片化的双重挑战。该平台目前已完成了对近百款主流模型的接入工作。

太初元碁技术总监及首席架构师夏忠谋表示,国产算力在超大规模集群的稳定性方面目前仍然面临挑战,但在推理场景下已经具备在该场景下的替代能力。太初元碁依托申威异构众核架构,通过提升片上CPU与GPU之间的通信效率来优化整体计算性能,在这一技术路径的支撑下,目前已能满足80%至90%的推理场景需求。他强调,国产算力的真正落地,需要算力厂商、独立软件开发商以及最终客户这三方进行紧密协作,共同以实际业务效果作为推进落地工作的核心导向。

提尔科技技术经理刘迎森指出,在Token的生产成本中,能耗所占的比例高达40%,而液冷技术能够将智算中心的PUE(电源使用效率)降至1.08,从而大幅度降低Token的能耗成本。提尔科技借助全浸没式液冷方案,成功实现了单机柜120千瓦的高密度部署,并且该技术还可以通过余热回收,为办公区提供供暖或为工业供应热水,最终达成“算力+热力”的双重收益。

来源:Token成为AI产业核心计量单位 成本优化成落地关键 | 财联社

声明:本文来自财联社,版权归作者所有。文章内容仅代表作者独立观点,不代表A³·爱力方立场,转载目的在于传递更多信息。如有侵权,请联系 copyright#agent.ren。

相关图文

热门资讯

推荐专栏

爱力方

爱力方

机器人前沿资讯及信息解读
机器人大讲堂

机器人大讲堂

中国顶尖的机器人专业媒体服务平台
关注爱力方,掌握前沿具身智能动态

© 2025 A³·爱力方

https://www.agentren.cn/