Coinbase把AI算力账单砍了一半，办法是换用中国模型

Brian Armstrong 在 X 上轻描淡写地发了一条消息，说 Coinbase 现在跑在 GLM 5.2 和 Kimi 2.7 这些中国模型上。这条消息淹没在 AI 圈的每日喧嚣里，但如果你仔细看数据，会发现一个信号：西方 AI 实验室正在被自己的高定价逼出一个竞争对手——而且这个竞争对手来自太平洋彼岸。

先说结果。Coinbase 的 token 使用量在过去几个月里创了历史新高，因为像 GPT-5.x-Thinking 和 Opus 4.5 这样的推理模型大量进来了。但与此同时，公司的 AI 支出却砍了一半。一半。Armstrong 说这话的时候语气很平淡，好像在说一件理所当然的事。

Coinbase AI成本优化示意图 — 企业 AI 支出优化正成为新的竞争力 | 制图：AI资讯

91% 的开发者根本不在乎你给了什么模型

这件事最反直觉的地方在于：Armstrong 并没有强制所有人换模型。开发者仍然可以自由选择任何模型。但数据告诉我们，91% 的人从来就没有触碰到旧的使用上限。他们用不满，是因为当前的模型够用了，或者他们根本懒得去调。

Coinbase 同时跑了一套自动路由系统，根据任务类型、价格和缓存可能性来挑最优模型。光是改进缓存策略这一项，就把缓存命中率从 5% 拉到了 60%。开发人员被建议保持上下文精简，为新任务开新会话——这套打法归属于当下流行的”上下文工程”范畴。

“你在 AI 上花的钱越多，我们期望你产出的影响就越大。”Armstrong 说这话的时候，把”tokenmaxxing”（无脑烧 token 刷内部分数榜）的文化打破了。Coinbase 没有设硬性上限，但把每个人的使用量公开了。这一招比直接封顶更狠。

不只是 Coinbase 一个人在干

初创公司 Lindy 的 CEO 最近把 Claude 整个扔了，全线换成 DeepSeek v4。Snowflake 的 CEO 测试下来觉得 GLM 5.2 在不少任务上跟 Opus 4.7 差不多，但价格只是一个零头。这些公司不是在用”便宜货”凑合，而是在用足够好的模型把成本结构打穿，然后把省下来的钱花在别的地方。

这对西方 AI 实验室来说是个实实在在的压力测试。OpenAI 和 Anthropic 还在准备 IPO，需要拿出漂亮的增长数字来支撑估值。但如果大客户开始用中国开源模型替代，那些增长数字还撑得住房吗？JPMorgan 最近在一份报告里列了一堆 AI 市场的红旗指标，其中”客户价格敏感度上升”被放在了显眼位置。

价格战已经悄悄打响了

有消息说 OpenAI 和 Anthropic 之间正在酝酿一场关于 API token 的价格战。OpenAI 刚推出的 GPT-5.6-Sol 跟 GPT-5.5 定价一样，但官方说法是比 Claude Fable 和 Mythos 更省 token。OpenAI 同时还放出了两个更弱的 5.6 变体，价格低得多。

这套打法很像当年的云服务价格战——亚马逊 AWS 用规模优势把价格压到竞争对手活不下去。现在轮到 AI 模型层了。唯一不同的是，这次”低价入侵者”来自中国，而且他们的模型真的不差。

📎 原文来源：Coinbase joins the rush to Chinese AI models as Western labs face a pricing stress test — The Decoder

发布时间：2026年6月28日 | 作者：Matthias Bastian

Coinbase把AI算力账单砍了一半，办法是换用中国模型

91% 的开发者根本不在乎你给了什么模型

不只是 Coinbase 一个人在干

价格战已经悄悄打响了

AnythingLLM — 61.7K Stars，全栈本地优先AI应用，私有知识库与AI代理一站式解决方案

社交媒体把算法权还给用户：Threads、Instagram、TikTok都在做的「你的算法」是什么？

做人形机器人的Agility Robotics要上市了，估值25亿美元

鱼眼视角高级时尚九宫格写真

n8n – 192K+ Stars，安全工作流自动化平台，原生AI能力加持

LangChain — 135K+ Stars 的 AI 智能体工程平台，构建 LLM 应用的首选框架

高通想做下一个英伟达，先掏出了Dragonfly CPU

DSPy：用编程取代提示词工程，Stanford 出品 LLM 应用优化框架，27.5K+ Stars