DeepSeek V4

DeepSeek バージョン履歴 | V1、V2、V3、R1、V4の進化タイムライン

2024年1月の初リリースから2026年のV4までのDeepSeekの完全な進化過程を目撃

DeepSeekは2024年1月の初リリース以来、各反復で重大な技術的突破をもたらしてきました。最初の67Bパラメータモデルから間もなくリリースされるV4まで、DeepSeekはオープンソースAIの境界を押し広げ続けています。

2024
01

DeepSeek正式リリース

DeepSeek LLM

初のオープンソース版、7Bと67Bの2つのスケールを提供。67B版はコード、数学、推論タスクでLLaMA-2 70Bを上回ります。トレーニングデータ2Tトークン、中国チームの大規模モデル分野での実力を証明。

7Bと67Bのダブルバージョン
2Tトークンでトレーニング
LLaMA-2 70Bを上回る
完全オープンソースモデルの重み
2024
03

ビジョン言語モデルリリース

DeepSeek-VL

オープンソースマルチモーダルモデル、1024×1024高解像度画像理解をサポート。複数のビジョン言語タスクで優れた表現、DeepSeekエコシステムにマルチモーダル能力を追加。

1024×1024高解像度
マルチモーダル理解
オープンソースの重みとトレーニングコード
ビジョンQ&A能力が優秀
2024
05

MoEアーキテクチャの重大な突破

DeepSeek-V2

Mixture-of-Experts(MoE)アーキテクチャを採用、総パラメータ236B、アクティブパラメータ21B、128Kコンテキストをサポート。トレーニングコスト42.5%削減、KV cacheを93.3%削減、スループット5.76倍向上。

総パラメータ236B、アクティブ21B
128K超長コンテキスト
トレーニングコスト42.5%削減
KV cache 93.3%削減
スループット5.76倍向上
2024
06

コードエキスパートモデル

DeepSeek-Coder-V2

コードタスクに特化したMoEモデル、338のプログラミング言語をサポート、128Kコンテキスト。追加で6Tトークンのコードデータをトレーニング、HumanEvalスコア89.5%。

338のプログラミング言語をサポート
128Kコードコンテキスト
追加6Tトークントレーニング
HumanEval 89.5%スコア
2024
12

フラッグシップモデルの性能飛躍

DeepSeek-V3

DeepSeek最強モデル、総パラメータ671B、アクティブパラメータ37B。14.8Tトークンをトレーニング、わずか2.788M H800 GPU時間のみ必要。トレーニングは安定しロールバックなし。

総パラメータ671B、アクティブ37B
14.8Tトークントレーニング
コストわずか2.788M GPU時間
トレーニング安定しロールバックなし
性能はGPT-4に近い
2025
01

推論モデルリリース

DeepSeek-R1

複雑な推論に特化したモデル、数学、プログラミング、論理推論などのタスクで卓越した表現。

推論能力の強化
数学推論の正解率向上
多段階論理推論
長鎖推論の安定性
2026
03
近日発売

V4間もなくリリース(予定)

DeepSeek-V4

1兆パラメータのネイティブマルチモーダルAI、100万+トークンコンテキスト、Engramメモリシステム。SWE-bench 80%+を目標、GPT-5.4より10-25倍安い。

1兆パラメータ、ネイティブマルチモーダル
100万+トークンコンテキスト(Engramメモリ)
DeepSeekスパースアテンション(DSA)
System 2推論

📊 主要指標の進化

指標V1 (2024.01)V2 (2024.05)V3 (2024.12)V4 (2026.03)
総パラメータ数67B236B671B未定
アクティブパラメータ67B21B37B最適化予定
コンテキスト長4K128K128K100万レベル(予想)
トレーニングデータ2T未定14.8Tさらに多く予定
コスト効率ベースライン↓ 42.5%継続的な最適化↓ 30%以上(予想)

🌟 コミュニティマイルストーン

50,000+
GitHub スター
オープンソースコミュニティから高く評価される
1,000,000+
モデルダウンロード
HuggingFace ダウンロード
100,000+
開発者
アクティブユーザー
1,500+
引用数
学術界で広く引用される

DeepSeekの進化の旅に参加

Atlas Cloudで最新版を体験し、次世代AIの誕生を目撃

無料で試す