DeepSeek V4 已发布：2026 年 4 月 24 日正式开源，规格与亮点回顾

等待终于结束。DeepSeek V4 已于 2026 年 4 月 24 日正式发布，并以 MIT 许可证完全开源，模型权重已发布于 Hugging Face。此前业界关于 V4 发布时间的种种推测——TechNode 报道、HuggingFace 上传活动、来自 GPT-5.4 与 Claude 4.6 的竞争压力——如今都已尘埃落定。本文回顾这次发布的核心事实、规格与基准成绩。

发布要点速览

发布日期：2026 年 4 月 24 日，DeepSeek-V4 预览版正式发布。
开源协议：MIT 许可证，权重发布于 Hugging Face。
两个版本：DeepSeek-V4-Pro 与 DeepSeek-V4-Flash。
核心定位：智能体编程 + 100 万 token 上下文 + 极致效率。
旧模型退役：deepseek-chat 与 deepseek-reasoner 将于 2026 年 7 月 24 日退役。

双版本规格

DeepSeek 这次一次性推出两个版本，覆盖从高端推理到低成本高吞吐的不同场景：

规格	DeepSeek-V4-Pro	DeepSeek-V4-Flash
总参数量	1.6 万亿（1.6T）	2840 亿（284B）
活跃参数量	49B	13B
上下文窗口	100 万（1M）token	100 万（1M）token
最大输出	约 384K token	约 384K token
定位	高端推理与智能体编程	更快、更低成本的场景

架构亮点：混合注意力（CSA + HCA）

V4 真正的效率突破在于其 MoE（混合专家）+ 混合注意力架构。它结合了：

CSA（压缩稀疏注意力，Compressed Sparse Attention）
HCA（高度压缩注意力，Heavily Compressed Attention）

这套设计使得在 100 万 token 上下文下，每 token 的算力约为 V3.2 的 27%，KV Cache 显存约为 V3.2 的 10%。换言之，V4 把超长上下文从"昂贵的奢侈品"变成了"人人用得起的默认能力"——这正是 V4 能以极低价格提供百万级上下文的根本原因。

基准成绩（V4-Pro 实测）

V4-Pro 在多项权威基准上交出了开源模型中的顶尖成绩：

基准	成绩
SWE-bench Verified	80.6%（开源模型最高，与 Gemini 3.1 Pro 并列）
LiveCodeBench Pass@1	93.5
Codeforces 评分	3206
MMLU-Pro	87.5%
GPQA Diamond	90.1%
GSM8K	92.6%
Terminal-Bench 2.0	67.9%

其中 SWE-bench Verified 80.6% 是当前开源模型的最高分，标志着 V4 在智能体编程领域已跻身第一梯队。

API 定价

V4 在发布后下调了 75%，给出了极具竞争力的长期价格：

版本	输入（/百万 token）	输出（/百万 token）
V4-Pro	$0.435	$0.87
V4-Flash	$0.14	$0.28

相比闭源前沿模型，V4 的价格便宜约 5-30 倍，同时完全开源，这是任何闭源竞品都无法提供的组合。

如何使用 DeepSeek V4

V4 已经发布，现在就可以通过以下方式使用：

方式一：网页端 chat.deepseek.com

访问 chat.deepseek.com 即可直接体验，提供两种模式：

Expert Mode（专家模式）：面向复杂推理与智能体编程任务。
Instant Mode（即时模式）：面向更快、更低成本的日常问答。

方式二：官方 API

前往 platform.deepseek.com 注册账号、创建 API Key 即可调用。模型名可使用 deepseek-v4-pro。

注意：旧模型 deepseek-chat 与 deepseek-reasoner 将于 2026 年 7 月 24 日退役，建议尽快迁移至 V4。

from openai import OpenAI

client = OpenAI(
    api_key="你的_API_KEY",
    base_url="https://api.deepseek.com",
)

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role": "user", "content": "用 Python 实现一个快速排序"}],
)
print(response.choices[0].message.content)

方式三：Atlas Cloud 与本地部署

Atlas Cloud：DeepSeek 官方推荐合作伙伴，发布即提供托管服务。
本地部署：V4 以 MIT 许可证开源，权重已在 Hugging Face 提供，可通过 vLLM、TGI 等推理框架自行部署。

此前的市场预期回顾

在 V4 正式发布之前，业界曾通过多个独立信号推测其发布时间窗口：TechNode 报道的内部进展、HuggingFace 上密集的上传活动，以及 GPT-5.4、Claude 4.6、Gemini 3.1 Pro 接连发布带来的竞争压力，都指向 DeepSeek 即将推出新一代模型。如今这些预期已经兑现——V4 现已正式发布，并以远超预期的效率与开源诚意回应了市场。

结语

DeepSeek V4 的发布，把"智能体编程能力、100 万 token 上下文、CSA+HCA 极致效率、完全开源（MIT）、极低价格"这五大特性集于一身。对于开发者而言，现在就是动手的最佳时机：上 chat.deepseek.com 体验，或接入 API 把 V4 融入你的工作流。

信息来源

以下为 DeepSeek 官方发布（2026-04-24）的信息整理：

DeepSeek 官方发布公告（2026 年 4 月 24 日）
Hugging Face DeepSeek 官方账号（模型权重）
chat.deepseek.com 与 platform.deepseek.com

部分第三方基准数据可能随评测更新而有所变化。

最后更新: 2026年4月24日

DeepSeek V4 已发布：2026 年 4 月 24 日正式开源，规格与亮点回顾

DeepSeek V4 已发布：2026 年 4 月 24 日正式开源，规格与亮点回顾

发布要点速览

双版本规格

架构亮点：混合注意力（CSA + HCA）

基准成绩（V4-Pro 实测）

API 定价

如何使用 DeepSeek V4

方式一：网页端 chat.deepseek.com

方式二：官方 API

方式三：Atlas Cloud 与本地部署

此前的市场预期回顾

结语

信息来源

立即体验 DeepSeek