AI这场仗打到现在,终于有人开始算账了。而且一算账,所有人都愣住了。
Uber今年前四个月就把全年的AI编程预算给烧光了。不是接近烧光,是真的烧光了。这件事听起来像个笑话,但它是真实发生的——一家市值几百亿美元的科技公司,在AI工具上花钱的速度,比他们做预算时最疯狂的假设还要快得多。
从”能用吗”到”多少钱”
Rebecca Bellan在TechCrunch写了一篇很扎实的报道,讲的是整个行业突然意识到AI不是免费午餐这件事。她的观察很准确:六个月前,企业和AI公司坐下来谈,话题全是”这个模型能做什么?效果够不够好?”现在再坐下来,问的问题变成了”我们到底花了多少钱?你们能提供什么可见性?有什么审计能力?”
AI企业业务负责人Alexander Embiricos说得很直白:”现在大家问的都是’我们花了这么多钱,你们能提供什么可见性?有什么审计能力?有什么token管控措施?你们的模型效率怎么样?'”
这个转变来得很快。快到很多企业根本没来得及建立任何成本管控机制。
几家欢乐几家愁
Priceline的一名员工告诉TechCrunch,他们常规Cursor合同的续约价格涨了4到5倍。微软在开放开发者Claude Code许可仅仅几个月之后,就撤销了相关授权。这些动作背后的逻辑很简单:AI工具的采购成本正在失控,而大多数公司对此几乎没有任何实时监控能力。
有一家企业因为忘记给员工设置使用限额,最终收到了一张5亿美元的Claude账单。这听起来像都市传说,但它是真实发生在2025年到2026年初某个时间点的事情。具体是哪家公司,报道里没有点名,但这反而让这个故事更有威慑力——因为任何一家在AI上”无上限”投入的公司,都有可能成为下一个主角。
token到底有多贵
单看每个token的价格,其实是在下降的。但问题是,AI智能体普及之后,token的消耗量是呈指数级增长的。Jellyfish的研究负责人Nicholas Arcolano提供了一组数据:使用token最多的工程师,生产力大约是使用AI较少的工程师的2倍,但他们消耗的token是后者的10倍。
换句话说,你花5倍的钱,换来了2倍的生产力。这笔账划不划算,取决于你用AI做出来的东西到底能卖多少钱。而大多数企业目前还无法衡量这一点。
Faros AI的CEO Vitaly Gordon说得更直白。他最近和一位CTO聊天,对方告诉他:”我有一个工程师上个月花了4万美元的token费用,我真的不知道是该阻止他,还是应该告诉其他人都向他学习。”
有人在想办法
市场永远不会让一个真实的需求空缺太久。Linux基金会在本周宣布了Tokenomics Foundation(代币经济学基金会)的成立计划。这个新的标准机构,目标是为AI token建立类似FinOps(云成本优化)为云支出建立的那种成本管控规范。
FinOps基金会的执行董事J.R. Stormet说,他从今年4月开始就不断听到企业说类似的话:”天呐,我们2026年的全年token预算才到4月就已经超了3倍。”他说他听到了很多”关乎企业生存的危机”,整个对话的重心从”tokenmaxing(最大化token使用量)”和”快速推进”,转向了”我们需要护栏,怎么控制成本?”
追踪token成本的难度,远比追踪云成本要高得多。Stormet说:”追踪云成本是一个每月需要处理数亿行数据的问题,而追踪token成本是一个每月需要处理数万亿行数据的问题。你不可能把它塞进任何电子表格甚至基础工具里。”
新玩家入局
针对这个需求的市场正在快速形成。有像Pay-i这样的纯业务公司,负责追踪、衡量和优化生成式AI投资的成本和性能;还有Paid,它让开发者可以追踪成本、衡量使用情况,并且根据实际价值而不是订阅费向用户收费。
此外还有Jellyfish、Waydev、Faros AI这类公司,它们都提供AI智能体监控服务,以证明开发工具的投资回报率。Stormet表示,FinOps基金会旗下的180家供应商中,大多数都在向这个领域倾斜。
已经有客户基础的成熟公司也在增加新功能,以抢占这个新市场。Ramp最近进入了AI支出管理领域;Datadog和New Relic增加了云成本管理、token级可观测性、GPU监控等服务。
标准缺失,乱象丛生
但所有这些工具都是在缺乏通用语言和共享定义的情况下开发的。没有统一的标准说明一个token的成本是多少、它能产生什么、以及如何跨供应商比较支出。这正是Tokenomics基金会希望发挥作用的地方。
该基金会正在为”代币经济学”建立权威的定义和框架;制定AI token使用和计费的开放标准、规范和指标;以及新的AI经济指标,比如每智能成本、每瓦特token数。它还计划定义token工厂效率和消耗效率相关的指标。
该组织计划在7月正式推出,下周将在FinOps X大会上宣布更多成员。但问题是,高盛预测到2030年全球token使用量将增长24倍。那些已经超支的企业现在就需要解决方案,而该基金会的第一个交付成果还要几个月才能推出。
也许我们还没准备好
Gordon说了一句很值得玩味的话:”也许我们创造了蒸汽机,但我们还没有搞清楚装配线。”
这句话精准地描述了2026年中全球AI行业的现状。我们有了强大的模型,有了愿意为它们付钱的企业,有了快速增长的用户基数。但我们还没有搞清楚如何让这场狂欢可持续——不只是技术上可持续,而是商业上可持续。
Uber花光全年AI预算的故事,不会是最后一个这样的故事。在token账单大到让CEO们无法忽视之前,类似的”翻车”还会继续发生。而等到那时候,Tokenomics Foundation的标准也许才刚刚准备好。
