DeepSeek V4

DeepSeek V4 출시 및 기능 | 1.6조 파라미터 MoE · 100만 토큰 · 오픈소스(MIT) 2026년 4월

DeepSeek V4 최신 소식: 1.6조 파라미터 MoE(49B 활성), 100만 토큰 컨텍스트, CSA+HCA 하이브리드 어텐션, SWE-bench Verified 80.6% | 2026년 4월 24일 출시·오픈소스(MIT)

최종 업데이트: 2026년 4월

DeepSeek V4는 2026년 4월 24일 정식 출시되어 오픈소스화(MIT)된 AI 모델입니다. V4-Pro(1.6조 파라미터, 49B 활성)와 V4-Flash(284B/13B) 두 버전을 제공하며, MoE에 CSA+HCA 하이브리드 어텐션을 결합해 100만 토큰 컨텍스트를 매우 낮은 비용(토큰당 연산 약 27%·KV Cache 약 10%, V3.2 대비)으로 처리합니다. SWE-bench Verified 80.6%의 에이전트 코딩 성능, 가중치는 Hugging Face에 공개.

📅 출시 타임라인

2024.12

DeepSeek-V3 출시

671B 파라미터, 37B 활성, MoE 아키텍처

2025.01

DeepSeek-R1 출시

복잡한 추론에 특화된 모델 공개, V4 개발의 기반

2026.04.24

V4 정식 출시·오픈소스(MIT)

V4-Pro(1.6조/49B) 및 V4-Flash(284B/13B) 출시, 가중치 Hugging Face 공개

2026.07.24

구 모델 퇴역 예정

deepseek-chat 및 deepseek-reasoner가 이날 퇴역, V4로 전환 권장

🚀 핵심 기능

DeepSeek 공식 발표(2026-04-24) 기반

🎯

에이전트 코딩 성능

V4-Pro는 SWE-bench Verified 80.6%로 오픈소스 모델 최고이며 Gemini 3.1 Pro와 동률, GPT-5.4(77.2%)를 상회합니다. 리포지토리 수준 코딩과 에이전트 워크플로우에 강합니다.

• SWE-bench Verified 80.6%(오픈소스 최고, Gemini 3.1과 동률)
• LiveCodeBench Pass@1 93.5
• Codeforces 평점 3206
• Terminal-Bench 2.0 67.9%

출처: DeepSeek 공식 벤치마크

🏗️

1.6조 파라미터 MoE

V4-Pro는 Mixture-of-Experts로 총 1.6조 파라미터에 토큰당 49B만 활성합니다. 더 가볍고 빠른 V4-Flash는 총 284B에 13B 활성으로 저비용·고속 시나리오에 적합합니다.

• V4-Pro: 총 1.6조 파라미터, 49B 활성
• V4-Flash: 총 284B 파라미터, 13B 활성
• Mixture-of-Experts(MoE) 아키텍처
• 완전 오픈소스(MIT), Hugging Face 가중치 공개

출처: DeepSeek 공식 기술 보고서

📚

100만 토큰 컨텍스트

두 버전 모두 기본 100만 토큰 컨텍스트 윈도우를 지원하며(최대 출력 약 384K 토큰), 전체 서적, 대형 코드베이스, 초장문 문서를 처리할 수 있습니다.

• 기본 100만 토큰 컨텍스트(두 버전 공통)
• 최대 출력 약 384K 토큰
• 완전한 대형 프로젝트 코드베이스 분석 가능
• 다중 턴 대화 메모리 크게 향상

출처: DeepSeek 공식

⚡

CSA+HCA 하이브리드 어텐션

MoE에 CSA(압축 희소 어텐션)와 HCA(고압축 어텐션)를 결합한 하이브리드 어텐션으로, 1M 컨텍스트에서 토큰당 연산은 V3.2의 약 27%, KV Cache 메모리는 약 10%까지 낮춥니다.

• CSA(압축 희소 어텐션) + HCA(고압축 어텐션) 결합
• 1M 컨텍스트에서 토큰당 연산 약 27%(V3.2 대비)
• KV Cache 메모리 약 10%(V3.2 대비)
• 저비용 초장문 컨텍스트 실현

출처: DeepSeek 공식 기술 보고서

🧩

두 가지 모델 버전

고급 추론·에이전트 코딩용 V4-Pro와, 더 빠르고 저렴한 V4-Flash를 함께 제공하여 용도에 맞게 선택할 수 있습니다.

• V4-Pro: 고급 추론 및 에이전트 코딩
• V4-Flash: 더 빠르고 저렴한 시나리오
• 두 버전 모두 100만 토큰 컨텍스트
• 두 버전 모두 오픈소스(MIT)

출처: DeepSeek 공식

🧠

강력한 추론·지식 성능

V4-Pro는 MMLU-Pro 87.5%, GPQA Diamond 90.1%, GSM8K 92.6% 등 추론과 지식 벤치마크에서 최상위권 성능을 보입니다.

• MMLU-Pro 87.5%
• GPQA Diamond 90.1%
• GSM8K 92.6%
• 복잡한 다단계 추론에 강점

출처: DeepSeek 공식 벤치마크

💰

초저비용 가격

75% 인하 후 장기 가격으로 V4-Pro는 입력 $0.435 / 출력 $0.87, V4-Flash는 입력 $0.14 / 출력 $0.28(백만 토큰)입니다. 오픈소스로 셀프 호스팅 무료.

• V4-Pro: 입력 $0.435 / 출력 $0.87 (백만 토큰)
• V4-Flash: 입력 $0.14 / 출력 $0.28 (백만 토큰)
• 폐쇄형 프론티어 모델보다 약 5-30배 저렴
• 오픈소스(MIT): 무료 셀프 호스팅

출처: DeepSeek 공식 가격

🔓

완전 오픈소스(MIT)

V4는 MIT 라이선스로 가중치가 Hugging Face에 공개되어, 상업적 사용·수정·재배포가 자유롭고 셀프 호스팅이 가능합니다. chat.deepseek.com(Expert/Instant 모드), 공식 API, Atlas Cloud로 접근.

• MIT 라이선스, Hugging Face 가중치 공개
• 상업적 사용·수정·재배포 자유
• chat.deepseek.com(Expert/Instant 모드)
• 공식 API 및 Atlas Cloud 지원

출처: DeepSeek 공식

🔬 기술 심층 분석

V4 아키텍처의 기술 혁신

아키텍처 혁신

✓ MoE + CSA+HCA 하이브리드 어텐션 구조
✓ CSA(압축 희소 어텐션)로 장거리 의존성 효율 처리
✓ HCA(고압축 어텐션)로 KV Cache 대폭 축소
✓ V4-Pro 1.6조/49B, V4-Flash 284B/13B 듀얼 구성

메모리·연산 효율

✓ 1M 컨텍스트에서 KV Cache 메모리 약 10%(V3.2 대비)
✓ 토큰당 연산 약 27%(V3.2 대비)
✓ 100만 토큰 컨텍스트를 저비용으로 지원
✓ 다중 GPU 추론 메모리 균형 최적화

성능·검증 결과

✓ SWE-bench Verified 80.6%(오픈소스 최고)
✓ LiveCodeBench Pass@1 93.5, Codeforces 3206
✓ MMLU-Pro 87.5%, GPQA Diamond 90.1%
✓ Terminal-Bench 2.0 67.9%

📊 V3 vs V4 비교

주요 업그레이드 포인트 개요

기능

파라미터

총 671B / 활성 37B

Pro 총 1.6조 / 49B 활성 · Flash 284B / 13B

주요 용도

범용 텍스트/코드

텍스트/코드/추론 중심, 에이전트 코딩

컨텍스트

128K 토큰

100만 토큰(기본)

효율

표준 KV Cache

1M 컨텍스트 KV Cache 약 10%·연산 약 27%(V3.2 대비)

어텐션

표준 MLA

CSA+HCA 하이브리드 어텐션

추론

표준

강화된 추론·에이전트 능력

API 가격(입력)

$0.28/1M 토큰

Pro $0.435 · Flash $0.14 / 1M 토큰

코딩(SWE-bench)

~70%

80.6%(Verified)

오픈소스

예, MIT

예, MIT(Hugging Face 공개)

접근 방식

API · 셀프 호스팅

chat.deepseek.com · 공식 API · Atlas Cloud · 셀프 호스팅

🏆 V4 vs 프론티어 모델

DeepSeek V4와 GPT-5.4, Claude 4.6, Gemini 3.1 Pro 비교

기능

DeepSeek V4

GPT-5.4

Claude 4.6

Gemini 3.1 Pro

출시일

2026년 4월 24일

2026년 3월 5일

2026년 2월 5일

2026년 2월 19일

컨텍스트 윈도우

100만

105만

100만

아키텍처

MoE + CSA/HCA

MoE

Dense

MoE

입력 가격

$0.435/M (Flash $0.14)

$2.50/M

$5.00/M

$2.00/M

출력 가격

$0.87/M (Flash $0.28)

$15.00/M

$25.00/M

$12.00/M

SWE-bench

80.6%

77.2%

80.8%

80.6%

LiveCodeBench

93.5 (Pass@1)

N/A

멀티모달

텍스트/코드/추론 중심

텍스트 + 비전 + 오디오

텍스트 + 비전

네이티브(텍스트/이미지/비디오/오디오)

오픈소스

✅ MIT

❌ 비공개

로컬 배포

✅ 무료 셀프 호스팅

❌ API만

📎 정보 출처

다음은 DeepSeek 공식 발표(2026-04-24) 기반 정보입니다

🟢

공식 발표

• 2026년 4월 24일 V4 정식 출시·오픈소스(MIT)
• V4-Pro 1.6조/49B 활성, V4-Flash 284B/13B
• 가중치 Hugging Face 공개, 100만 토큰 컨텍스트

🟢

공식 벤치마크

• SWE-bench Verified 80.6%, LiveCodeBench 93.5
• MMLU-Pro 87.5%, GPQA Diamond 90.1%, GSM8K 92.6%
• Codeforces 3206, Terminal-Bench 2.0 67.9%

🟢

공식 가격 및 접근

• V4-Pro 입력 $0.435 / 출력 $0.87 (백만 토큰)
• V4-Flash 입력 $0.14 / 출력 $0.28 (백만 토큰)
• chat.deepseek.com · 공식 API · Atlas Cloud

⚠️ 안내: 위 정보는 DeepSeek 공식 발표(2026-04-24)를 기반으로 합니다. 일부 제3자 벤치마크 수치는 평가 갱신에 따라 달라질 수 있습니다.

🎁 V4를 지금 바로 사용하는 방법

Atlas Cloud에서 DeepSeek V4를 즉시 이용 가능

✅ V4 출시 완료, 지금 바로 이용 가능

✅ 서버 설정 불필요, API 직접 호출

✅ V3 코드와 호환, 마이그레이션 비용 무료

✅ 엔터프라이즈급 안정성 및 기술 지원

지금 Atlas Cloud 등록

계정 등록, 무료 크레딧 획득

API 키 받기

콘솔에서 API 키 생성, 즉시 V4 액세스

모델 지정

API 요청에서 모델을 'deepseek-v4-pro'(또는 'deepseek-v4-flash')로 지정. 구 deepseek-chat은 2026년 7월 24일 퇴역 예정

📬 V4 업데이트 구독

DeepSeek V4 최신 업데이트와 튜토리얼을 가장 먼저 받기

✓ 최신 업데이트 알림✓ 기술 분석 기사✓ 사용 튜토리얼✓ 특별 혜택

DeepSeek V4 지금 바로 체험

V4가 출시되었습니다. 지금 Atlas Cloud에 등록하고 바로 사용하세요

지금 등록