DeepSeek V4 完整规格：1.6T MoE、CSA+HCA、100 万 token 上下文（2026 已发布）

2026 年 4 月 24 日，DeepSeek 正式发布并开源了 DeepSeek V4 预览版，权重以 MIT 许可证发布于 Hugging Face。此前社区中流传的种种猜测如今尘埃落定：V4 并非靠"无限记忆"或"原生多模态"取胜，而是以智能体编程能力、100 万 token 长上下文与极致推理效率作为核心，重新定义了开源前沿模型的性价比。本文基于官方发布信息，对 V4 的完整规格进行权威解析。

双版本设计：Pro 与 Flash

DeepSeek V4 一次发布了两个版本，分别面向不同的算力与成本场景：

版本	总参数量	活跃参数量	定位
DeepSeek-V4-Pro	1.6 万亿（1.6T）	49B	高端推理与智能体编程
DeepSeek-V4-Flash	284B	13B	更快、更低成本的日常场景

两个版本均采用 MoE（混合专家）架构，默认提供 100 万（1M）token 上下文窗口，最大输出约 384K token。Pro 以最强的推理与编程能力为目标，Flash 则在保持高质量的同时大幅压低延迟与成本，适合高并发、对响应速度敏感的应用。

需要一个单一对标数字时，通常以 V4-Pro 的 1.6T 总参数 / 49B 活跃参数为准。

混合注意力架构：CSA + HCA

V4 真正的效率突破在于其 混合注意力架构——它将两种注意力机制结合在一起：

CSA（压缩稀疏注意力，Compressed Sparse Attention）：对长序列进行稀疏化处理，仅在相关位置之间计算注意力，大幅降低长上下文的计算量。
HCA（高度压缩注意力，Heavily Compressed Attention）：对 KV 表征进行高度压缩，显著削减显存占用。

两者结合，使 V4 在处理 100 万 token 上下文时，每 token 算力约为 V3.2 的 27%、KV Cache 显存约为 V3.2 的 10%。

指标（1M 上下文）	DeepSeek V3.2	DeepSeek V4
每 token 算力	100%	约 27%
KV Cache 显存	100%	约 10%
上下文窗口	—	100 万 token

这正是 V4 能够以极低价格提供百万级上下文的根本原因：不是靠外挂的"记忆数据库"，而是靠注意力机制本身的结构性效率。

真实定价：开源前沿模型的性价比标杆

V4 的 API 价格在发布时已下调 75%，进入长期价位：

模型	输入价格（/百万 token）	输出价格（/百万 token）
DeepSeek-V4-Pro	$0.435	$0.87
DeepSeek-V4-Flash	$0.14	$0.28
GPT-5.4	$2.50	$15.00
Claude 4.6（Opus）	$5.00	$25.00
Gemini 3.1 Pro	$2.00	$12.00

以 V4-Pro 对比闭源前沿模型，输入价格约便宜 5-12 倍、输出价格约便宜 14-29 倍；而 V4-Flash 更低，配合缓存命中优惠后实际成本还能进一步下降。对于以 MIT 协议自行部署的用户而言，则没有任何 API 费用。

基准成绩：智能体编程与推理的全面领先

以下为 V4-Pro 已发布的真实基准成绩，不再是发布前的"目标/预期"：

基准	DeepSeek V4-Pro
SWE-bench Verified	80.6%（开源模型最高，与 Gemini 3.1 Pro 并列）
LiveCodeBench Pass@1	93.5
Codeforces 评分	3206
MMLU-Pro	87.5%
GPQA Diamond	90.1%
GSM8K	92.6%
Terminal-Bench 2.0	67.9%

其中 SWE-bench Verified 的 80.6% 是开源模型中的最高分，与 Gemini 3.1 Pro 并列，标志着 V4 在真实世界软件工程任务上已跻身第一梯队。Codeforces 评分 3206、LiveCodeBench 93.5、Terminal-Bench 2.0 67.9% 等成绩，则共同印证了 V4 在算法竞赛、代码生成与终端智能体任务上的强劲实力。

开源与访问方式

DeepSeek V4 以 MIT 许可证开源，权重发布于 Hugging Face，这意味着：

完全免费商用：企业可直接将 V4 集成进产品，无附加限制。
自由修改分发：研究者可在 V4 基础上微调、蒸馏与二次开发。
本地部署：可在自有基础设施上完整运行，最大化数据私密性。

访问 V4 的主要方式：

chat.deepseek.com：提供 Expert Mode（专家模式）与 Instant Mode（即时模式）。
官方 API：模型名可使用 deepseek-v4-pro 等；旧的 deepseek-chat 与 deepseek-reasoner 将于 2026 年 7 月 24 日退役。
Atlas Cloud 等第三方平台：atlascloud.ai 通常会第一时间上线新的 DeepSeek 模型。

总结：V4 的核心价值

DeepSeek V4 的发布表明，开源前沿模型的竞争焦点已经清晰：

双版本设计：Pro（1.6T/49B）与 Flash（284B/13B）覆盖高端推理到低成本场景。
100 万 token 上下文：长文档、整库代码、跨多轮的智能体任务皆可胜任。
CSA + HCA 混合注意力：以约 27% 算力、10% KV 显存实现极致的长上下文效率。
智能体编程领先：SWE-bench Verified 80.6%，开源最高。
极低价格 + MIT 开源：性价比与开放度兼得，推动 AI 普惠。

V4 不再依赖发布前传闻中的"无限记忆"或"原生多模态"包装，而是用扎实的架构效率与真实的基准成绩，证明了开源模型同样可以站在前沿。

信息来源

以下为 DeepSeek 官方于 2026-04-24 发布的信息：

DeepSeek V4 官方发布公告与技术说明
Hugging Face DeepSeek 组织页（模型权重，MIT 许可证）
chat.deepseek.com / 官方 API 文档与定价页

免责声明：部分第三方基准数据可能随评测版本更新而变化，请以官方与各评测榜单的最新结果为准。

最后更新: 2026年4月25日

DeepSeek V4 完整规格：1.6T MoE、CSA+HCA、100 万 token 上下文（2026 已发布）

DeepSeek V4 完整规格：1.6T MoE、CSA+HCA、100 万 token 上下文（2026 已发布）

双版本设计：Pro 与 Flash

混合注意力架构：CSA + HCA

真实定价：开源前沿模型的性价比标杆

基准成绩：智能体编程与推理的全面领先

开源与访问方式

总结：V4 的核心价值

信息来源

立即体验 DeepSeek