모델·서비스

DeepSeek

딥시크

AI 모델 분야에서 중국 DeepSeek사가 2024~2025년에 공개한 LLM(Large Language Model, 거대 언어 모델) 시리즈로, 미국 플래그십 모델 수준 성능을 훨씬 적은 학습 비용으로 달성한 추론·코딩 특화 오픈웨이트 모델입니다.

쉬운 풀이

중국 작은 연구팀이 미국 빅테크가 1억 달러 들여 만든 모델을 600만 달러로 따라 잡고, 게다가 설계도까지 무료로 풀어 버린 사건이에요. 시험으로 치면 한 학기 등록금 다 부어 1등 한 학생을 옆 반 친구가 학원 한 달 다닌 비용으로 비슷한 점수를 받아 온 셈입니다. 게다가 그 친구가 자기 노트 필기까지 그대로 복사해서 누구나 가져가게 풀어 줬어요. 학과 단톡방이 뒤집어졌다고 생각하면 비슷한데, AI 업계에서는 실제로 NVIDIA 주가가 하루에 6천억 달러나 빠지는 사건으로 번졌습니다.

한 줄 비유

대형 외주 없이 사내팀이 만든 사양서를 누구나 받아 쓰는 표준 양식입니다.

활용 예시

Case 1

DeepSeek-V3 공개 — 학습 비용 약 557만 달러, GPT-4 대비 6% 수준

DeepSeek-V3 공식 기술 보고서는 H800 GPU 시간 약 278만 8천 시간, 시간당 2달러 환산 기준 사전학습 비용 약 557만 6천 달러를 명시했습니다.^[3] 같은 시점 GPT-4 학습 비용은 약 1억 달러로 추정되어, V3는 그 6% 수준에 머무릅니다.^[4] MoE(Mixture-of-Experts, 전문가 혼합) 구조와 MLA(Multi-head Latent Attention, 다중 헤드 잠재 어텐션)로 토큰당 활성화 파라미터를 370억으로 줄인 설계가 비용 절감의 핵심이었다고 보고됩니다.^[3] 다만 SemiAnalysis 분석에 따르면 누적 서버 CapEx(고정자산 투자)는 약 16억 달러 규모로, "총 투자액"으로 오해하면 안 된다는 점도 함께 강조됩니다.^[6]

Case 2

DeepSeek-R1 공개 — NVIDIA 시가총액 하루 약 6천억 달러 증발

2025년 1월 27일 R1 공개 직후 NVIDIA 주가는 16.9% 하락해 단일 종목 사상 최대 시가총액 감소액인 약 6천억 달러가 하루 만에 증발했습니다.^[7] "고성능 칩 없이도 비슷한 성능을 낼 수 있다"는 인식이 데이터센터 관련주 전반에 퍼지면서 Dell·Oracle·Super Micro도 8.7% 이상 동반 하락했습니다.^[7] R1 논문은 AIME 2024 정답률을 15.6%에서 71.0%로 끌어올렸다고 보고했으며, 같은 논문이 2025년 Nature(645권 633~638쪽)에 정식 게재되어 학술적 검증까지 마쳤다는 점이 시장 충격을 키웠다는 평가가 많습니다.^[1]

Case 3

한국 — 이스트소프트 앨런, R1 국내 최초 도입

이스트소프트는 2025년 2월 10일 AI 검색 서비스 '앨런(Allen)'에 DeepSeek-R1을 국내 최초로 적용했다고 발표했습니다.^[8] 적용된 R1은 오픈소스 가중치 기반으로 중국 본사 서버와 완전히 분리된 독립 클라우드에서 운영되며, 자회사 이스트시큐리티의 '알약xLLM'이 데이터 유출을 차단하는 구조입니다.^[8] 이스트소프트는 저비용·고성능 R1 도입으로 비용 효율이 개선돼 회원 가입 없이도 앨런을 이용할 수 있게 무료 기능을 확장한다고 밝혔습니다.^[8] 같은 시점 외교부·국방부·산업부 등 정부 부처는 보안 우려로 딥시크 앱 자체 접속을 차단해, "본사 직접 사용"과 "오픈웨이트 사내 배포"가 서로 다른 트랙으로 운영되고 있다는 점이 분명해졌습니다.^[9]

Case 4

AWS Bedrock — DeepSeek-R1 글로벌 엔터프라이즈 채널 정식 서빙

AWS는 2025년 3월 DeepSeek-R1을 Amazon Bedrock에서 완전 관리형(fully managed) 모델로 정식 출시했고, 한국 리전 사용자도 별도 인프라 구축 없이 단일 API 호출로 R1을 사용할 수 있게 됐습니다.^[10] AWS 한국 블로그는 R1이 오픈웨이트로 풀려 사내 가상사설망(VPC) 안에서 호출되도록 통제 가능하다는 점을 강조했고, MIT 라이선스 기반이라 상업적 사용·미세조정·재배포가 모두 허용된다고 명시했습니다.^[10][5] 이 채널을 통해 한국 엔터프라이즈는 중국 본사 서버 우회 없이도 R1을 사내 코드 리뷰·문서 요약·검색 백엔드에 결합할 수 있는 구조를 확보한 셈입니다.^[10]

참고사항

Hugging Face deepseek-ai/DeepSeek-R1 페이지에서 모델 카드와 MIT 라이선스 원문을 확인합니다.
R1 논문(arXiv 2501.12948) 벤치마크 표만 읽고 자사 업무 중 "정답이 검증되는 과제"를 한 줄로 정리합니다.
DeepSeek API에 가입해 동일 프롬프트를 GPT·Claude와 비교 호출하고 토큰 단가·응답 품질을 표로 정리합니다.
사내 정보보안 담당자와 "중국 서버 경유 가능성"을 검토하고 입력 금지 데이터 항목을 사전에 합의합니다.
증류 모델(7B·14B)을 사내 GPU 1장에서 띄워 외부 API 없는 환경의 응답 품질을 측정합니다.

공개된 "약 557만 달러 학습 비용"은 V3 사전학습 단계의 GPU 시간 환산치이며, R&D·인프라·운영·인건비를 합친 전체 투자액이 아닙니다.^[6] SemiAnalysis는 누적 서버 CapEx(고정자산 투자)만 약 16억 달러, H100·H800급 GPU 약 5만 장 규모의 클러스터를 추정했습니다.^[6] 또한 V3 기술 보고서의 비용 환산은 "H800 GPU 시간 × 시간당 2달러" 가정에 기반하므로, 임차료·전력·실패 실험 비용은 포함되지 않습니다.^[3] 한국에서는 2025년 초 개인정보 무단 국외 이전이 확인돼 외교부·국방부·산업부 등 다수 정부 부처가 접속을 차단했고, 개인정보보호위원회 시정권고를 거쳐 서비스가 재개됐습니다.^[9] 민감 정보를 다루는 조직은 본사 API 대신 자체 호스팅 또는 AWS Bedrock 같은 한국 인프라 위 추론 환경을 검토하는 편이 안전합니다.^[10]

진화 방향은 두 축으로 정리됩니다.

V3 후속(V3.1·V3.2)과 R1 후속(R1-0528) 공개를 거치며 추론·코딩 성능과 가격 경쟁력을 함께 끌어올리고 있고, MIT 라이선스 유지와 가중치 공개 기조도 이어지고 있습니다.^[5][11] DeepSeek API 단가는 입력 100만 토큰 약 $0.14, 출력 약 $0.28부터 시작해 동급 미국 모델 대비 90% 이상 저렴한 구간을 유지합니다.^[11]
학계에서는 "사람 라벨링 없이 강화학습만으로 자기검증·반성 같은 추론 패턴이 출현했다"는 점이 다른 연구팀들의 재현 시도(Hugging Face의 open-r1 등)로 이어지고 있어, 오픈웨이트 추론 모델군의 기준점 역할을 한다는 평가가 많습니다.^[1] 한국 시장에서는 이스트소프트 앨런이 국내 최초 적용 사례를 만든 데 이어, AWS Bedrock 한국 리전을 통한 엔터프라이즈 도입이 본격화되는 단계이며, 사내 RAG(Retrieval-Augmented Generation, 검색 증강 생성) 구조에 증류 모델을 결합하는 시도도 늘고 있습니다.^[8][10]

이 용어와의 관계

유사 개념
Fireworks AI같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
Together AI같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
Groq같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.