DeepSeek V4 完全スペック：1.6T MoE、CSA+HCA、100万トークンコンテキスト（2026年リリース済み）

2026年4月24日、DeepSeekはDeepSeek V4プレビュー版を正式にリリースし、MITライセンスでHugging Face上にウェイトを公開しました。これまでコミュニティで飛び交っていた憶測には決着がつきました。V4は「無限メモリ」や「ネイティブマルチモーダル」で勝負するのではなく、エージェントコーディング能力、100万トークンの長大コンテキスト、そして極限の推論効率を核として、オープンソースのフロンティアモデルにおけるコストパフォーマンスを再定義したのです。本記事では、公式リリース情報に基づき、V4の完全なスペックを解説します。

デュアルバージョン設計：ProとFlash

DeepSeek V4は2つのバージョンを同時にリリースし、それぞれ異なる計算量・コストのシナリオに対応します：

バージョン	総パラメータ	アクティブパラメータ	位置づけ
DeepSeek-V4-Pro	1.6兆（1.6T）	49B	ハイエンド推論・エージェントコーディング
DeepSeek-V4-Flash	284B	13B	より高速・低コストの日常用途

両バージョンともMoE（Mixture-of-Experts）アーキテクチャを採用し、デフォルトで100万（1M）トークンのコンテキストウィンドウを提供、最大出力は約384Kトークンです。Proは最強の推論・コーディング能力を目指し、Flashは高品質を維持しつつレイテンシとコストを大幅に削減するため、高並列・応答速度を重視するアプリケーションに最適です。

単一の比較数値が必要な場合は、通常V4-Proの1.6T総パラメータ / 49Bアクティブパラメータを基準とします。

ハイブリッドアテンションアーキテクチャ：CSA + HCA

V4の真の効率上のブレークスルーは、そのハイブリッドアテンションアーキテクチャにあります。これは2つのアテンション機構を組み合わせたものです：

CSA（圧縮スパースアテンション、Compressed Sparse Attention）：長いシーケンスをスパース化し、関連する位置間でのみアテンションを計算することで、長大コンテキストの計算量を大幅に削減します。
HCA（高度圧縮アテンション、Heavily Compressed Attention）：KV表現を高度に圧縮し、メモリ使用量を大幅に削減します。

両者を組み合わせることで、V4は100万トークンのコンテキストを処理する際、**トークンあたりの計算量はV3.2の約27%、KV Cacheメモリは約10%**で済みます。

指標（1Mコンテキスト）	DeepSeek V3.2	DeepSeek V4
トークンあたり計算量	100%	約27%
KV Cacheメモリ	100%	約10%
コンテキストウィンドウ	—	100万トークン

これこそが、V4が100万トークンのコンテキストを極めて低価格で提供できる根本的な理由です。外付けの「メモリデータベース」ではなく、アテンション機構そのものの構造的効率によるものなのです。

実際の価格：オープンソースのコストパフォーマンスの基準

V4のAPI価格はリリース時にすでに75%引き下げられ、長期的な価格帯に入っています：

モデル	入力価格（/100万トークン）	出力価格（/100万トークン）
DeepSeek-V4-Pro	$0.435	$0.87
DeepSeek-V4-Flash	$0.14	$0.28
GPT-5.4	$2.50	$15.00
Claude 4.6（Opus）	$5.00	$25.00
Gemini 3.1 Pro	$2.00	$12.00

V4-Proをクローズドソースのフロンティアモデルと比較すると、入力価格は約5〜12倍安く、出力価格は約14〜29倍安くなっています。V4-Flashはさらに低価格で、キャッシュヒット割引を組み合わせれば実際のコストはさらに下がります。MITライセンスでセルフホスティングするユーザーにとっては、API費用は一切かかりません。

ベンチマーク：エージェントコーディングと推論で全面的にリード

以下はV4-Proの公開された実際のベンチマークスコアであり、リリース前の「目標／予想」ではありません：

ベンチマーク	DeepSeek V4-Pro
SWE-bench Verified	80.6%（オープンモデル最高、Gemini 3.1 Proと同率）
LiveCodeBench Pass@1	93.5
Codeforces レーティング	3206
MMLU-Pro	87.5%
GPQA Diamond	90.1%
GSM8K	92.6%
Terminal-Bench 2.0	67.9%

SWE-bench Verifiedの**80.6%**はオープンソースモデルの中で最高スコアであり、Gemini 3.1 Proと同率で、実世界のソフトウェアエンジニアリングタスクにおいてV4がトップティアに躍り出たことを示しています。Codeforcesレーティング3206、LiveCodeBench 93.5、Terminal-Bench 2.0 67.9%といったスコアは、アルゴリズム競技、コード生成、ターミナルエージェントタスクにおけるV4の強さを裏付けています。

オープンソースとアクセス方法

DeepSeek V4はMITライセンスでオープンソース化され、ウェイトはHugging Faceで公開されています。これは以下を意味します：

完全に無料の商用利用：企業は追加の制限なくV4を製品に統合できます。
自由な改変と配布：研究者はV4をベースにファインチューニング、蒸留、二次開発が可能です。
ローカルデプロイ：自社インフラ上で完全に実行でき、データプライバシーを最大化できます。

V4へのアクセスの主な方法：

chat.deepseek.com：Expert Mode（エキスパートモード）とInstant Mode（インスタントモード）を提供。
公式API：deepseek-v4-proなどのモデル名を使用可能。旧来のdeepseek-chatとdeepseek-reasonerは2026年7月24日に廃止される予定です。
Atlas Cloudなどのサードパーティプラットフォーム：atlascloud.ai は通常、新しいDeepSeekモデルをいち早く提供します。

まとめ：V4のコアバリュー

DeepSeek V4のリリースは、オープンソースのフロンティアモデルの競争の焦点を明確にしました：

デュアルバージョン設計：Pro（1.6T/49B）とFlash（284B/13B）が、ハイエンド推論から低コスト用途までをカバー。
100万トークンコンテキスト：長大な文書、リポジトリ全体のコード、複数ターンにわたるエージェントタスクに対応。
CSA + HCAハイブリッドアテンション：約27%の計算量、約10%のKVメモリで極限の長大コンテキスト効率を実現。
エージェントコーディングのリード：SWE-bench Verifiedで80.6%、オープンモデル最高。
超低価格 + MITオープンソース：コストパフォーマンスと開放性を両立し、AIの普及を推進。

V4はもはや、リリース前の噂にあった「無限メモリ」や「ネイティブマルチモーダル」というパッケージングに頼りません。確固たるアーキテクチャ効率と実際のベンチマークスコアによって、オープンソースモデルもフロンティアに立てることを証明したのです。

情報源

以下はDeepSeekが2026年4月24日に公式リリースした情報です：

DeepSeek V4 公式リリース発表と技術説明
Hugging Face DeepSeek組織ページ（モデルウェイト、MITライセンス）
chat.deepseek.com / 公式APIドキュメントと価格ページ

免責事項：一部のサードパーティのベンチマークデータは評価バージョンの更新により変化する可能性があります。公式および各リーダーボードの最新結果をご参照ください。

最終更新: 2026年4月25日

DeepSeek V4 完全スペック：1.6T MoE、CSA+HCA、100万トークンコンテキスト（2026年リリース済み）

DeepSeek V4 完全スペック：1.6T MoE、CSA+HCA、100万トークンコンテキスト（2026年リリース済み）

デュアルバージョン設計：ProとFlash

ハイブリッドアテンションアーキテクチャ：CSA + HCA

実際の価格：オープンソースのコストパフォーマンスの基準

ベンチマーク：エージェントコーディングと推論で全面的にリード

オープンソースとアクセス方法

まとめ：V4のコアバリュー

情報源

DeepSeek を今すぐ体験