DeepSeek V4

DeepSeek V4 新功能解析 | 万亿参数百万token 开源MIT 2026年4月发布

DeepSeek V4最新消息：万亿参数MoE、CSA+HCA混合注意力、百万token上下文、智能体编程SWE-bench 80.6% | 2026年4月24日已发布

最后更新于 2026年4月

DeepSeek V4已于2026年4月24日正式发布并开源（MIT许可证）。提供V4-Pro（1.6T总参数/49B活跃，面向高端推理与智能体编程）与V4-Flash（284B/13B，面向更快更低成本场景）两个版本，均支持100万token上下文。采用MoE + CSA+HCA混合注意力架构，SWE-bench Verified实测80.6%（开源模型最高）。价格比闭源前沿模型便宜约5-30倍，完全开源可自部署。

📅 发布时间表

2024.12

DeepSeek-V3 发布

671B 参数，37B 活跃，MoE 架构

2025.01

DeepSeek-R1 发布

专注复杂推理，数学与编程表现出色

2026.04

V4 正式发布

2026年4月24日发布并开源（MIT），万亿参数，100万token上下文

2026.04

企业版同步上线

Atlas Cloud 同步提供 V4 企业服务

🚀 核心功能

基于 DeepSeek 官方发布（2026-04-24）

🎯

顶尖智能体编程

DeepSeek V4 实测 SWE-bench Verified 80.6%，为开源模型最高（与 Gemini 3.1 Pro 并列），专为智能体编程与软件工程任务打造。

• SWE-bench Verified 80.6%（开源最高）
• LiveCodeBench Pass@1 93.5
• Codeforces 评分 3206
• Terminal-Bench 2.0 67.9%

来源: DeepSeek 官方基准

🏗️

万亿参数 MoE

V4-Pro 拥有 1.6 万亿总参数，通过混合专家架构每次推理仅激活 49B 参数；V4-Flash 为 284B 总参数 / 13B 活跃。实现前沿性能的同时成本极低。

• V4-Pro：1.6T 总参数，49B 活跃
• V4-Flash：284B 总参数，13B 活跃
• 混合专家（MoE）架构
• 完全开源（MIT），可自部署

来源: DeepSeek 官方

📚

百万级 Token 上下文

两个版本均支持 100 万 token 上下文窗口（默认），最大输出约 384K token，可处理整本书、大型代码库或超长文档。

• 默认 100 万 token 上下文
• 最大输出约 384K token
• 可分析完整的大型项目代码库
• 支持处理整本书（~50 万词）

来源: DeepSeek 官方

🧬

CSA+HCA 混合注意力

V4 采用 MoE + 混合注意力架构，结合 CSA（压缩稀疏注意力）与 HCA（高度压缩注意力），在百万级上下文下大幅降低算力与显存开销。

• CSA + HCA 混合注意力机制
• 1M 上下文每 token 算力约为 V3.2 的 27%
• KV Cache 显存约为 V3.2 的 10%
• 低成本支持 100 万 token 上下文

来源: DeepSeek 官方

⚡

极致推理效率

依托混合注意力设计，V4 在长上下文场景下显著降低每 token 算力与 KV Cache 显存占用，使百万 token 上下文在成本上变得可行。

• 每 token 算力约为 V3.2 的 27%
• KV Cache 显存约为 V3.2 的 10%
• 长上下文成本大幅下降
• 高吞吐、低延迟推理

来源: DeepSeek 官方

🧠

强大推理能力

V4 在知识与推理基准上表现优异：MMLU-Pro 87.5%、GPQA Diamond 90.1%、GSM8K 92.6%，可分解复杂问题并逐步推理。

• MMLU-Pro 87.5%
• GPQA Diamond 90.1%
• GSM8K 92.6%
• 复杂问题多步推理

来源: DeepSeek 官方基准

💰

价格极低

DeepSeek V4 已下调 75% 后的长期价格：V4-Pro 输入 $0.435 / 输出 $0.87，V4-Flash 输入 $0.14 / 输出 $0.28（每百万 token）。开源意味着可免费自部署。

• V4-Pro：输入 $0.435 / 输出 $0.87
• V4-Flash：输入 $0.14 / 输出 $0.28
• 比闭源前沿模型便宜约 5-30 倍
• 开源（MIT）：免费自部署

来源: DeepSeek 官方定价

🔓

完全开源（MIT）

V4 权重以 MIT 许可证发布于 Hugging Face，可自由下载、商用与自部署，无供应商锁定。可通过 chat.deepseek.com、官方 API 与 Atlas Cloud 访问。

• MIT 许可证，权重在 Hugging Face
• 可自由商用与自部署
• Expert Mode / Instant Mode 在线体验
• 兼容 OpenAI 格式 API

来源: DeepSeek 官方

🔬 技术深度分析

V4 架构的技术创新

架构创新

✓ MoE + CSA+HCA 混合注意力架构
✓ CSA（压缩稀疏注意力）+ HCA（高度压缩注意力）
✓ 改进的 MoE 专家路由算法
✓ Pro 1.6T/49B 与 Flash 284B/13B 双版本

内存与上下文

✓ KV Cache 显存约为 V3.2 的 10%
✓ 默认支持 100 万 token 上下文
✓ 最大输出约 384K token
✓ 长上下文显存占用大幅下降

效率提升

✓ 1M 上下文每 token 算力约为 V3.2 的 27%
✓ 长上下文成本显著降低
✓ 高吞吐推理
✓ API 价格已下调 75%

📊 V3 VS V4 对比

主要升级点概览

功能

参数量

671B 总 / 37B 活跃

Pro 1.6T/49B，Flash 284B/13B

模态

纯文本

以文本/代码/推理为主

上下文

128K tokens

100万 tokens（默认，最大输出约 384K）

注意力

标准 MLA

CSA+HCA 混合注意力

效率

基准

1M 上下文每 token 算力约 27%、KV 显存约 10%

编程（SWE-bench）

约 70%

80.6%（开源最高）

API 价格（输入）

$0.28/100万 tokens

Pro $0.435，Flash $0.14 /100万 tokens

API 价格（输出）

$0.42/100万 tokens

Pro $0.87，Flash $0.28 /100万 tokens

开源

是，MIT

访问方式

API / 自部署

chat.deepseek.com / API / Atlas Cloud / 自部署

🏆 V4 vs 前沿模型

DeepSeek V4 与 GPT-5.4、Claude 4.6、Gemini 3.1 Pro 的对比

功能

DeepSeek V4

GPT-5.4

Claude 4.6

Gemini 3.1 Pro

发布日期

2026年4月24日

2026年3月5日

2026年2月5日

2026年2月19日

上下文窗口

100万

105万

100万

架构

MoE + CSA+HCA

MoE

Dense

MoE

输入价格

$0.435/M（Pro）

$2.50/M

$5.00/M

$2.00/M

输出价格

$0.87/M（Pro）

$15.00/M

$25.00/M

$12.00/M

SWE-bench

80.6%

77.2%

80.8%

80.6%

GPQA Diamond

90.1%

N/A

94.3%

多模态

以文本/代码/推理为主

文本 + 视觉 + 音频

文本 + 视觉

原生（文本/图像/视频/音频）

开源

✅ MIT

❌ 闭源

本地部署

✅ 免费自部署

❌ 仅限 API

📎 信息来源

以下为 DeepSeek 官方发布（2026-04-24）的信息

🟢

发布与开源

• 2026年4月24日 V4 预览版正式发布并开源（MIT）
• 权重发布于 Hugging Face
• 提供 V4-Pro（1.6T/49B）与 V4-Flash（284B/13B）

🟢

架构与效率

• MoE + CSA+HCA 混合注意力，支持 100 万 token 上下文
• 1M 上下文每 token 算力约为 V3.2 的 27%、KV 显存约 10%
• API 价格已下调 75%（Pro $0.435/$0.87，Flash $0.14/$0.28）

🟢

实测基准

• SWE-bench Verified 80.6%（开源最高，与 Gemini 3.1 Pro 并列）
• LiveCodeBench 93.5、Codeforces 3206、Terminal-Bench 2.0 67.9%
• MMLU-Pro 87.5%、GPQA Diamond 90.1%、GSM8K 92.6%

⚠️ 免责声明：上述为 DeepSeek 官方发布（2026-04-24）的信息。部分第三方基准数据可能随评测更新而变化。

🎁 如何立即使用 V4？

V4 已上线，Atlas Cloud 同步提供企业服务

✅ 已正式发布，立即可用

✅ 无需服务器配置，直接 API 调用

✅ 兼容 V3 代码，零升级成本

✅ 企业级稳定性和技术支持

立即注册 Atlas Cloud

注册账号，获得免费额度

获取 API 密钥

在控制台创建密钥，即刻调用 V4

切换模型

在 API 请求中将模型改为 'deepseek-v4-pro' 或 'deepseek-v4-flash'

📬 订阅 V4 更新与教程

第一时间获取 DeepSeek V4 更新、教程与最佳实践

✓ 产品更新通知✓ 技术分析文章✓ 使用教程✓ 特别优惠

V4 已发布，立即开始使用

立即注册 Atlas Cloud，即刻体验 DeepSeek V4

立即注册

DeepSeek V4 新功能解析 | 万亿参数 百万token 开源MIT 2026年4月发布

📅 发布时间表

🚀 核心功能

顶尖智能体编程

万亿参数 MoE

百万级 Token 上下文

CSA+HCA 混合注意力

极致推理效率

强大推理能力

价格极低

完全开源（MIT）

🔬 技术深度分析

架构创新

内存与上下文

效率提升

📊 V3 VS V4 对比

🏆 V4 vs 前沿模型

📎 信息来源

发布与开源

架构与效率

实测基准

🎁 如何立即使用 V4？

📬 订阅 V4 更新与教程

V4 已发布，立即开始使用

DeepSeek V4 新功能解析 | 万亿参数百万token 开源MIT 2026年4月发布