暂无菜单项

GPT-5.5卖180刀,DeepSeek只收0.28刀:大模型价格战到底卷到了什么程度

发布于
3

最近看到一个数据,差点把咖啡喷出来——GPT-5.5每百万token要180美元,而DeepSeek V4 Flash只要0.279美元。算一下,价差645倍。这什么概念?相当于一辆法拉利和一辆五菱宏光的差距。但问题在于,五菱宏光在日常通勤里可能比法拉利好使。

有人做了个实验,把同一个任务分别扔给GPT-5.5、Claude Opus、Gemini 3.1 Flash和DeepSeek V4 Flash跑了一遍。结果挺有意思:写复杂代码、做多步推理、处理那种模糊需求的时候,GPT-5.5确实强得离谱,能读懂你话里的潜台词。但换成整理文档、写周报、翻译邮件、分析数据这些日常活儿,四个模型基本看不出区别。

2024年同等水平的推理成本是20美元/百万token,两年后的今天降到了0.07美元。两年内下降了280倍。

五强模型,差距越来越小

现在市面上的头部模型——GPT-5.4、Claude Opus 4.6、Gemini 3.1 Pro、DeepSeek V3和Kimi K2.5,在Elo评分榜上的差距已经压缩到只有2.7%。说实话,这个差距在大多数使用场景下根本感知不到。以前大家比的是”谁更聪明”,现在核心问题变成了:这个模型适合我的场景吗?预算用得起吗?跟我现有的工具链能接上吗?

训练成本的变化也挺魔幻的。DeepSeek V3的训练成本是557万美元,而GPT-4的训练据说超过1亿美元。差了将近16倍。但输出质量呢?日常使用几乎拉不开差距。我觉得DeepSeek赢的不只是价格,更是证明了”够用”这个概念的商业价值。

选模型的新逻辑

现在业内的共识已经变了——不是找最强的,是找最对口的。通用任务和自动化工作流用GPT-5.4,长文档处理和高质量代码用Claude Opus 4.6,多模态理解用Gemini 3.1 Pro,成本敏感和中文场景用DeepSeek V3,超长上下文需求就上Kimi K2.5。

  • Claude的百万级上下文不是噱头,整个代码库扔进去分析是真的好用
  • DeepSeek V4 Flash的100万token窗口能塞进大型代码仓库
  • GLM-4.7在华为昇腾上训练,直接把推理价格压到行业最低的0.11美元
  • Claude Token消耗比GPT高出55%,长文档场景要掂量钱包

老话说得好,你不会开法拉利去买菜,同样也没必要用GPT-5.5写周报。对普通团队来说,以前调一次API几块钱,做大项目光模型成本就上百万。现在一个中小团队花几千块能用一年。这种成本的崩塌速度,说实话超出了我去年最乐观的预期。


2026年的AI行业像极了2010年的智能手机市场。还在拼参数的公司可能被讲性价比的公司打得找不着北。真正的战场已经不是模型本身了,而是Agent、工具链和工作流整合。模型只是基础设施,谁能让AI真正干活,谁才是赢家。

0 点赞
0 收藏
分享
0 讨论
反馈
0 讨论
热门最新
总结
暂无总结
0 / 600