艾瑞咨询于MWC上海发布Token成本精益管理服务,破解企业AI支出

释放双眼,带上耳机,听听看~!
在大模型应用爆发式增长的当下,如何控制推理成本成为企业核心痛点

为期三天的2026 MWC上海今日落下帷幕。作为全球规模最大、最具影响力的ICT行业盛会之一,本届大会汇聚了全球百余个国家和地区的科技巨头与创新力量,共同探索智能未来的边界。

在大模型应用爆发式增长的当下,如何控制推理成本成为企业核心痛点。敏锐捕捉这一行业需求的艾瑞咨询,在大会期间正式推出了“Token成本精益管理服务”。针对企业AI支出快速增长却难以量化管理的痛点,提供从消耗可视化到价值评估的全链路治理方案。该服务将Token成本治理方法论转化为可运行的管理机制,旨在帮助企业将AI支出从"说不清的成本"转变为"算得清、管得住、越投越值的战略投资"。

image.png

图:Token成本精益管理服务产品受到企业客户青睐

"上个月AI花了多少?花得值吗?"

艾瑞咨询调研发现,从月耗百万Token的中型公司到年支出过亿的集团企业,几乎没有一家能在初次沟通时说清AI成本的全貌。Token消耗以秒计增长,AI治理却近乎缺位――这一矛盾正在加剧。

高盛研究(Goldman Sachs Research)在《AI Agents Forecast to Boost Tech Cash Flow as Usage Soars》中预测,受AI智能体驱动,2030年全球Token消耗量将达到2026年的24倍。与此同时,Redress Compliance数据显示73%的企业AI部署超预算,MIT指出95%的AI项目未能证明ROI,Cast AI 2026年调研更揭示企业GPU平均利用率仅为5%。AI投入持续攀升,回报却模糊不清。

Token管理不能照搬云成本老办法

艾瑞咨询认为,"管AI"与"管云"存在四点根本性差异,即便已具备成熟FinOps能力的企业,在AI成本治理时仍会面临全新挑战:

1. 消耗单元不同。 云资源按实例、存储、流量计费,边界清晰;Token消耗则因模型差异、提示词差异,可能相差数十倍乃至上百倍。

2. 用量弹性不同。 云资源通常按月采购,相对可预测;Token消耗是实时的,一个失控的Agent几小时就能耗尽整月预算。

3. 价值归因困难。 云费用可对应到服务器、数据库等具体基础设施;Token消耗如何折算成业务产出,目前尚无行业标准。

4. 账单天然碎片化。 企业云资源通常集中在少数云厂商;AI调用却分散在云平台、第三方API(OpenAI、DeepSeek等)及自有算力等多处,没有一张表能看清全貌。

这意味着,企业不能简单照搬云成本管理的既有路径,而需要针对Token消耗的实时性、归因复杂性和账单碎片化等特征进行针对性改造。

四阶段飞轮:从"看清"到"价值"的治理闭环

基于FinOps云成本治理实践经验,以及对Token经济特性的系统研究,艾瑞咨询将Token管理方法论总结为"四阶段飞轮",形成持续运转的管理闭环:

阶段一・看清: 建立跨平台、跨部门的Token消耗统一视图,理清钱花在哪、谁在花、花多少。通过六维标签体系构建多维消费画像,这是治理的前提。

阶段二・优化: 基于用量数据识别低效调用,从Prompt设计、模型选型到工程层的分层缓存与智能路由,系统性降低单次任务的Token成本。

阶段三・管控: 在API调用实时链路上部署管控机制,设置预算阈值与自动熔断,将治理从"事后对账"前移至"事中拦截",实现分层、可调、有激励的预算与配额控制。

阶段四・价值: 持续追踪关键AI应用的成本变化与产出趋势,运用价值评估四维模型与七种量化算法,把"AI支出值不值"的讨论从凭经验判断转向有数据支撑的价值评估,推动AI支出从被动消耗的"成本项"走向可衡量、可优化的"价值项"。

四个阶段循环往复,使Token管理形成自优化闭环――让企业的每一个Token,都花得清楚、用得高效、管得有度、收到回报。

image.png

图:AI价值管理飞轮的四阶段递进,形成自优化的管理闭环

三级服务体系:拒绝"一个方法适配所有企业"

不同企业的AI应用成熟度、痛点需求和预算存在显著差异。为此,艾瑞咨询将Token管理服务设计为三个层级:

轻量诊断 ―― 适合初步使用AI的企业。2至4周内完成Token消耗全景摸排,形成优先治理清单,以最低成本构建"看清"的基础能力。

标准治理 ―― 适合已有一定AI使用规模、需要建立系统治理机制的企业,覆盖标签体系搭建、预算分配框架设计与场景化ROI核算模型输出。

深度定制 ―― 适合AI支出量大、业务场景复杂的企业,提供与业务系统深度集成的实时管控方案,并支持持续运营托管。

艾瑞咨询建议多数企业从"轻量诊断"起步,先"看清"再"优化",避免等到Token成本大幅攀升后才仓促应对。

与传统咨询的三大本质区别

相较于市场上已有的AI成本管理方案,艾瑞咨询的Token成本精益管理服务实现了三点核心创新:

第一,交付"机制",而非"报告"。 传统咨询以提供报告为终点,但Token消耗以秒计算,等月底对账可能为时已晚。艾瑞咨询将方法论落地为可运行的技术工具,将管控逻辑部署在API调用的实时链路上――即便咨询团队离场,系统仍可持续运转。

第二,工具背后有方法论。 很多企业已具备企业级API Gateway能力,却仍无法回答"标签体系如何设计、预算如何拆分、ROI如何核算"。艾瑞咨询每个技术模块背后,都有完整的Token成本管理方法体系与云成本治理经验支撑。

第三,能做成本效益对标。 艾瑞咨询持续追踪中国企业AI市场,结合前沿AI行业应用洞察,以最新落地场景引领企业未来AI发力方向,而非仅停留在"你应该怎么做"的建议层面。

image.png

图:艾瑞咨询与传统服务的本质区别

关于艾瑞咨询

艾瑞咨询是国内深耕新经济洞察与产业数智化落地的专业咨询机构。依托二十余年产业研究与数字化咨询实践积累,艾瑞咨询已形成覆盖产业研判、战略规划、企业数智化转型全流程的服务体系,持续为各行各业提供可落地的研究方案与转型路径支撑。

基于长期一线项目沉淀,艾瑞咨询搭建起“行业洞察+数据底座+方法论体系+配套技术工具+长期运营托管”五位一体落地模式,依托对行业场景、模型调用逻辑与成本结构的深度理解,协助国内企业系统性理顺AI投入产出体系,高效应对AI规模化运营过程中的成本管控难题。

温馨提示:本站提供的一切软件、教程和内容信息都来自网络收集整理,仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负,版权争议与本站无关。用户必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。如果您喜欢该程序和内容,请支持正版,购买注册,得到更好的正版服务。我们非常重视版权问题,如有侵权请邮件与我们联系处理。敬请谅解!

给TA打赏
共{{data.count}}人
人已打赏
热点资讯

今日科技观察|GPT-5.6遭逐级审批

2026-6-26 16:24:29

热点资讯

AI+金融科技解锁数智金融新场景

2026-6-26 18:45:22

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索