暂无菜单项

DeepSeek V4 发布:1.6万亿参数开源,百万上下文成标配,价格比 GPT-4 便宜70倍

发布于
4

DeepSeek 这次真的把天花板给顶破了。4月24日,他们正式发布 DeepSeek-V4 预览版,同步全量开源,上线 Hugging Face 和 ModelScope,附带580G 开源权重。消息一出,资本市场立刻有了反应——SMIC 和华虹半导体在香港双双大涨。

1M 上下文,标配了

V4 系列最直观的升级是上下文窗口直接拉到100万 token,所有官方服务默认配置。用大白话讲,就是你扔给它一部长篇小说让它分析,它一口气全吞下去,中间不需要你翻页或者重新喂。

但这还不是最厉害的。他们搞了一套 Token-wise 压缩加上 DSA 稀疏注意力机制,推理时的 FLOPs 直接降低了73%,KV 缓存大小减少了90%。说白了,不是粗暴地堆算力,而是在工程层面做了精细优化。

DeepSeek V4
DeepSeek-V4 发布,百万上下文成标配

两个版本怎么选?

V4-Pro 总参数1.6万亿,激活参数490亿,性能定位是”开源最强、接近顶级闭源”。内部员工体验说比 Sonnet 4.5 强,交付质量接近 Opus 4.6 的非思考模式。API 价格做到了 GPT-4 的七十分之一,每百万 token 输入0.14美元、输出3.48美元。

V4-Flash 走的是经济路线,2840亿总参数、130亿激活参数,API 价格低到离谱——输入每百万 token 只要3美分,比 Claude Opus 4.7 便宜99%以上。简单任务用它完全够用,高难度任务建议开思考模式、强度拉满。

国产算力这波秀肌肉

更值得关注的是 DeepSeek V4 对国产算力的适配程度。官方数据显示,在华为昇腾 950PR 上推理速度比 V3 版本快了整整35倍,能耗还降低了40%。他们还适配了寒武纪芯片,MXFP4 低精度格式降低了对 NVIDIA CUDA 生态的依赖。

这意味着什么?DeepSeek 不再只是”开源模型里很强”,而是真正在国产硬件上跑出了能打的体验。对国内企业来说,部署成本和使用门槛都在大幅下降。开源协议用的是 MIT,完全开放商用。


DeepSeek V4 把百万上下文、开源和低成本三个事情同时做到位了。开源社区等了这么久的东西,终于来了。

0 点赞
0 收藏
分享
0 讨论
反馈
0 讨论
热门最新
总结
暂无总结
0 / 600