DeepSeek V4 发布：1.6万亿参数开源，百万上下文成标配，价格比 GPT-4 便宜70倍

DeepSeek 这次真的把天花板给顶破了。4月24日，他们正式发布 DeepSeek-V4 预览版，同步全量开源，上线 Hugging Face 和 ModelScope，附带580G 开源权重。消息一出，资本市场立刻有了反应——SMIC 和华虹半导体在香港双双大涨。

V4 系列最直观的升级是上下文窗口直接拉到100万 token，所有官方服务默认配置。用大白话讲，就是你扔给它一部长篇小说让它分析，它一口气全吞下去，中间不需要你翻页或者重新喂。

但这还不是最厉害的。他们搞了一套 Token-wise 压缩加上 DSA 稀疏注意力机制，推理时的 FLOPs 直接降低了73%，KV 缓存大小减少了90%。说白了，不是粗暴地堆算力，而是在工程层面做了精细优化。

V4-Pro 总参数1.6万亿，激活参数490亿，性能定位是”开源最强、接近顶级闭源”。内部员工体验说比 Sonnet 4.5 强，交付质量接近 Opus 4.6 的非思考模式。API 价格做到了 GPT-4 的七十分之一，每百万 token 输入0.14美元、输出3.48美元。

V4-Flash 走的是经济路线，2840亿总参数、130亿激活参数，API 价格低到离谱——输入每百万 token 只要3美分，比 Claude Opus 4.7 便宜99%以上。简单任务用它完全够用，高难度任务建议开思考模式、强度拉满。

更值得关注的是 DeepSeek V4 对国产算力的适配程度。官方数据显示，在华为昇腾 950PR 上推理速度比 V3 版本快了整整35倍，能耗还降低了40%。他们还适配了寒武纪芯片，MXFP4 低精度格式降低了对 NVIDIA CUDA 生态的依赖。

这意味着什么？DeepSeek 不再只是”开源模型里很强”，而是真正在国产硬件上跑出了能打的体验。对国内企业来说，部署成本和使用门槛都在大幅下降。开源协议用的是 MIT，完全开放商用。

DeepSeek V4 把百万上下文、开源和低成本三个事情同时做到位了。开源社区等了这么久的东西，终于来了。

鱼眼视角高级时尚九宫格写真