Qwen
큐웬
AI 모델 분야에서 중국 Alibaba가 공개한 오픈웨이트 LLM(Large Language Model, 거대 언어 모델) 시리즈로, 다국어·코딩·추론·멀티모달 기능을 갖춘 채로 가중치를 공개해 누구나 다운로드해 직접 운영할 수 있게 한 모델군입니다.
Qwen은 중국 알리바바가 만든 거대 언어 모델인데, ChatGPT나 Claude처럼 API로만 쓰는 게 아니라 모델 파일을 통째로 공개해 누구나 노트북·서버에 받아 돌릴 수 있습니다. 대학교 1학년이 도서관 책을 빌리면 정해진 페이지밖에 못 보지만, 교수님 연구실에서 책 전체 PDF를 그냥 받아 가는 느낌이에요. 한국어를 포함해 119개 언어를 학습했기 때문에, 영어 모델로는 어려운 한국어 시험 정리·코드 주석 작성도 비교적 자연스럽게 해냅니다. 지금 한국 스타트업이 자체 LLM을 만들 때 '처음부터 학습'이 아니라 'Qwen을 받아 한국어로 다듬는' 길을 가는 이유라 알아 두면 좋습니다.
사내 서버에 그대로 올릴 수 있는 표준 결재 시스템을 통째로 받아 오는 셈입니다.
알리바바 Qwen 팀 — Qwen3 235B 추론 모델 공개
2025년 4월 알리바바는 Qwen3 시리즈를 Apache 2.0으로 공개하면서 최상위 라인 Qwen3-235B-A22B(총 235B 파라미터·활성 22B)에 추론(Thinking) 모드와 일반 모드를 한 모델에 통합했습니다.[1] 약 36조 토큰·119개 언어로 사전학습해 다국어·코딩·수학 영역에서 동급 오픈 모델 중 최상위권 점수를 받았고, MoE 구조로 8개 전문가 신경망만 활성화해 235B 대비 운영 비용을 22B 수준으로 낮췄습니다.[1] 추론 전용 모델을 따로 운영하지 않아도 되는 점에서 도입을 검토하는 팀이 늘고 있습니다.
엘리스(Elice) — Korean Qwen2.5 한국어 특화 모델 공개
엘리스 공식 블로그에 따르면 엘리스는 Qwen2.5-32B·72B Instruct를 한국어로 재정렬해 'Korean Qwen2.5'를 공개했고, NVIDIA H100 GPU 8장으로 약 2일 만에 학습을 끝냈습니다.[3] 글로벌 모델이 한국어 질문에 영어로 답하는 언어 전환 오류를 크게 줄였고, KMMLU·GSM8K·HumanEval 평가에서 SOLAR·EXAONE과 견줄 만한 성적을 보고했습니다.[3] Apache 2.0 라이선스라 자사 서비스에 그대로 탑재할 수 있어, 국내 챗봇·RAG 도입에 채택되고 있습니다.
알리바바 클라우드 Model Studio — 상용 API 운영
알리바바 클라우드 공식 문서에 따르면 Model Studio는 qwen-max·qwen-plus·qwen-turbo와 멀티모달 Qwen-VL·음성 Qwen-Audio·이미지 Wanx 2.1을 OpenAI 호환 API로 묶어 기업 고객에게 제공합니다.[5] DashScope SDK 또는 OpenAI 호환 엔드포인트로 호출하기 때문에, 기존에 GPT-4를 쓰던 코드를 base_url과 모델명만 바꿔 동일 코드 베이스로 PoC할 수 있습니다.[5] 사내 GPU 인프라 검토 전에 같은 모델 계열을 클라우드 API로 먼저 비교 검증하려는 기업에 진입 선택지로 쓰입니다.
Hugging Face 생태계 — Qwen이 Llama 제치고 다운로드 1위
미국 ATOM Project가 Hugging Face 데이터를 분석한 결과, 2026년 초 누적 다운로드 1위 자리가 Llama에서 Qwen으로 넘어간 것으로 집계됐습니다.[7] Yahoo Finance 보도에 따르면 Qwen3-Omni-30B-A3B가 Hugging Face 인기 모델 1위에 올랐고, Qwen3-VL·Wan 비디오 모델 등 알리바바 오픈 모델이 상위 10위 중 절반을 차지했습니다.[8] Apache 2.0이라 사용자 규모·증류 제한이 없어 학계·스타트업의 파인튜닝 베이스로 빠르게 자리잡았습니다.
- arXiv 2505.09388(Qwen3 Technical Report)을 열어 모델 라인업 표와 119개 언어 항목을 5분간 확인합니다.
- Hugging Face의 Qwen/Qwen3-8B 모델 카드를 열어 라이선스가 Apache 2.0임을 캡처해 사내 법무 검토 자료로 둡니다.
- ollama 또는 vLLM으로 Qwen3 8B를 로컬에 띄워, 한국어 질문에 한국어로 답하는지와 사고(Thinking) 모드 응답 길이를 비교합니다.
- 알리바바 클라우드 Model Studio에서 qwen-max를 OpenAI 호환 엔드포인트로 호출해 자사 GPT 사용량과 단가·지연을 단순 비교 표로 정리합니다.
- 엘리스클라우드 모델 라이브러리에서 Korean Qwen2.5-32B에 자사 도메인 질문 10개를 넣어 응답 일관성을 KMMLU 점수와 함께 메모합니다.
Qwen은 가중치와 코드는 Apache 2.0으로 풀려 있지만, 학습 데이터셋과 학습 파이프라인 전체가 공개된 '정식 오픈 소스 AI'는 아닙니다. Open Source Initiative 기준으로는 오픈웨이트(open-weight) 모델군으로 분류되며, Llama·DeepSeek와 같은 카테고리에서 비교됩니다.[9] 또한 알리바바 본사가 중국 기업이라는 점에서 일부 규제 산업(공공·금융·국방)은 도입 전 데이터 처리 위치와 라이선스 조항을 별도로 검토할 필요가 있습니다.[5] 235B 같은 대형 라인은 자체 호스팅 비용이 만만치 않아, 모든 조직이 오픈웨이트의 이득을 그대로 받기는 어렵습니다.[1]
진화 방향은 세 갈래입니다.
- Qwen3 보고서가 명시하듯 추론(Thinking)·비추론(Non-thinking) 모드를 한 모델에 통합하고 사고 토큰 예산을 조절하는 구조로 옮겨가고 있어, 기업이 추론 전용 모델과 일반 챗 모델을 따로 운영하지 않아도 됩니다.[1]
- 다국어 지원이 Qwen2.5 29개에서 Qwen3 119개 언어·방언으로 확대되어 한국어를 포함한 비영어 시장 진입 비용이 낮아지고 있습니다.[1][2]
- 엘리스 Korean Qwen2.5처럼 국내 파생 모델 사례가 늘면서, 한국어 도메인 모델은 처음부터 학습하지 않고 Qwen을 베이스로 SFT(Supervised Fine-Tuning, 지도 기반 미세조정)·DPO(Direct Preference Optimization, 사람 선호 데이터를 바로 반영하는 정렬 기법)를 얹는 경로가 표준 작업 방식으로 굳어지고 있습니다.[3] 실무에서는 '오픈웨이트를 직접 호스팅할 것인가, Model Studio API로 외주할 것인가, 한국어 파생 모델을 받아 쓸 것인가'의 세 선택지를 함께 검토해야 한다는 의미입니다.
- 유사 개념Fireworks AI같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.
- 유사 개념Together AI같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.
- 유사 개념Groq같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.
- Qwen3 Technical Report (arXiv:2505.09388) — 기술 보고서 · arXiv · 2025-05-14
- Qwen2.5 Technical Report (arXiv:2412.15115) — 기술 보고서 · arXiv · 2024-12
- Alibaba Cloud Model Studio — OpenAI-Compatible Qwen Access — 회사 공식 문서 · Alibaba Cloud · 2025
- 한국어 특화 LLM, 엘리스 Korean Qwen2.5 모델 리뷰 (32B/72B) — 회사 공식 발표 · 엘리스 블로그 · 2025-04
- Meta's Llama AI Model Hits 1 Billion Downloads — 권위 매체 · Maginative · 2025-03
- Qwen3-8B Model Card (License: Apache 2.0) — 회사 공식 모델 카드 · Hugging Face · 2025
- Qwen3 GitHub Repository — 회사 공식 저장소 · Alibaba Cloud Qwen Team · 2025
이 페이지가 도움이 되었나요?
제안·수정 요청은 meet@percent.ac 로 보내주시면 다음 갱신에 반영합니다.