暂无菜单项

Coinbase把AI算力账单砍了一半,办法是换用中国模型

发布于
1

Brian Armstrong 在 X 上轻描淡写地发了一条消息,说 Coinbase 现在跑在 GLM 5.2 和 Kimi 2.7 这些中国模型上。这条消息淹没在 AI 圈的每日喧嚣里,但如果你仔细看数据,会发现一个信号:西方 AI 实验室正在被自己的高定价逼出一个竞争对手——而且这个竞争对手来自太平洋彼岸。

先说结果。Coinbase 的 token 使用量在过去几个月里创了历史新高,因为像 GPT-5.x-Thinking 和 Opus 4.5 这样的推理模型大量进来了。但与此同时,公司的 AI 支出却砍了一半。一半。Armstrong 说这话的时候语气很平淡,好像在说一件理所当然的事。

Coinbase AI成本优化示意图
企业 AI 支出优化正成为新的竞争力 | 制图:AI资讯

91% 的开发者根本不在乎你给了什么模型

这件事最反直觉的地方在于:Armstrong 并没有强制所有人换模型。开发者仍然可以自由选择任何模型。但数据告诉我们,91% 的人从来就没有触碰到旧的使用上限。他们用不满,是因为当前的模型够用了,或者他们根本懒得去调。

Coinbase 同时跑了一套自动路由系统,根据任务类型、价格和缓存可能性来挑最优模型。光是改进缓存策略这一项,就把缓存命中率从 5% 拉到了 60%。开发人员被建议保持上下文精简,为新任务开新会话——这套打法归属于当下流行的”上下文工程”范畴。

“你在 AI 上花的钱越多,我们期望你产出的影响就越大。”Armstrong 说这话的时候,把”tokenmaxxing”(无脑烧 token 刷内部分数榜)的文化打破了。Coinbase 没有设硬性上限,但把每个人的使用量公开了。这一招比直接封顶更狠。

不只是 Coinbase 一个人在干

初创公司 Lindy 的 CEO 最近把 Claude 整个扔了,全线换成 DeepSeek v4。Snowflake 的 CEO 测试下来觉得 GLM 5.2 在不少任务上跟 Opus 4.7 差不多,但价格只是一个零头。这些公司不是在用”便宜货”凑合,而是在用足够好的模型把成本结构打穿,然后把省下来的钱花在别的地方。

这对西方 AI 实验室来说是个实实在在的压力测试。OpenAI 和 Anthropic 还在准备 IPO,需要拿出漂亮的增长数字来支撑估值。但如果大客户开始用中国开源模型替代,那些增长数字还撑得住房吗?JPMorgan 最近在一份报告里列了一堆 AI 市场的红旗指标,其中”客户价格敏感度上升”被放在了显眼位置。


价格战已经悄悄打响了

有消息说 OpenAI 和 Anthropic 之间正在酝酿一场关于 API token 的价格战。OpenAI 刚推出的 GPT-5.6-Sol 跟 GPT-5.5 定价一样,但官方说法是比 Claude Fable 和 Mythos 更省 token。OpenAI 同时还放出了两个更弱的 5.6 变体,价格低得多。

这套打法很像当年的云服务价格战——亚马逊 AWS 用规模优势把价格压到竞争对手活不下去。现在轮到 AI 模型层了。唯一不同的是,这次”低价入侵者”来自中国,而且他们的模型真的不差。

📎 原文来源:Coinbase joins the rush to Chinese AI models as Western labs face a pricing stress test — The Decoder

发布时间:2026年6月28日 | 作者:Matthias Bastian

0 点赞
0 收藏
分享
0 讨论
反馈
0 讨论
热门最新
总结
暂无总结
0 / 600