暂无菜单项

AI代币账单到期:企业花掉全年预算只用了4个月

发布于
3

Uber今年4月就用完了2026年全年的AI编程预算。这件事听起来像段子,但它是真的。微软在给开发者开放Claude Code权限几个月后,悄无声息地撤销了授权。Priceline的一名员工告诉TechCrunch,Cursor的常规续约合同价格涨了4到5倍。

AI成本失控
企业AI支出正在失控(图源:TechCrunch)

代币账单到期了

尽管单个token的价格在下降,但AI的普及加上越来越自主的AI智能体,让token消耗量成倍增长。2025年初大量采购”无限量订阅”套餐的企业,现在正手忙脚乱地搞清楚钱都花到了哪里。

OpenAI企业业务负责人亚历山大·恩比里科斯本周在纽约的一场活动中说得很直白:”六个月前和客户沟通,话题全是’它能做什么?效果够不够好?’现在这些话题根本不会出现了。现在的话题全是’嘿,我们花了太多钱了。你们能提供什么可见性?有什么审计能力?有什么token管控措施?你们的模型效率怎么样?'”

“这就像可卡因泛滥一样。供应商先让你免费试用,让你上瘾,现在你就被它套牢了。”——Priceline IT财务高级总监 Chris Reed

新模型让消耗爆炸

2025年11月发布的新模型——Anthropic的Claude Opus 4.5、OpenAI的GPT-5.1和谷歌的Gemini 3 Pro——大幅提升了智能体工具的能力,也让token消耗量成倍增长。据报道,有一家公司因为忘记给员工设置使用限额,收到了5亿美元的Claude账单。

工程运营平台Faros AI的CEO维塔利·戈登说,他最近和一位CTO沟通,对方告诉他:”我手下的一个工程师上个月花了4万美元买token,我真的不知道该阻止他,还是该告诉其他人都要像他一样用。”

生产力提升的说法越来越模糊

Faros今年4月发布的一项针对2万名开发者、为期两年的研究发现,开发者的产出确实在上升,但bug和返工的情况也在增加。工程管理平台Jellyfish也得出了类似的结论:使用token最多的工程师的生产效率大约是使用AI较少的工程师的2倍,但他们为此消耗的token是后者的10倍。

Jellyfish的研究负责人尼古拉斯·阿科拉诺说:”极端支出是否值得,最终取决于上线代码带来的实际商业价值,而大多数企业目前还无法衡量这一点。”


Tokenomics基金会来了

正是在这样的背景下,Linux基金会本周公布了成立Tokenomics Foundation(代币经济学基金会)的计划。这是一个新的标准机构,目标是给AI token建立类似FinOps给云成本带来的成本管控规范。

FinOps基金会的执行董事J.R. 斯托门特说:”今年4月和5月,我开始听到企业说:’天呐,我们2026年的全年token预算已经超支3倍了,现在才4月。’我们听到了很多关乎企业存亡的危机。”

该基金会正在为”代币经济学”建立权威的定义和框架,计划7月正式推出。与此同时,一个市场已经在形成——Ramp、Datadog、New Relic,以及专门的初创公司如Pay-i和Paid,都在争相为企业提供AI成本管控工具。

高盛预测到2030年全球token使用量将增长24倍。那些已经超支的企业现在就需要解决方案,而该基金会的首个成果还要几个月才能推出。就像戈登说的:”也许我们创造了蒸汽机,但还没有搞清楚装配线怎么建。”

0 点赞
0 收藏
分享
0 讨论
反馈
0 讨论
热门最新
总结
暂无总结
0 / 600