Hugging Face
허깅페이스
AI 개발도구 분야에서 2016년에 설립된 Hugging Face가 운영하는 모델·데이터셋 공유 플랫폼으로, 누구나 머신러닝 모델을 업로드하고 사용·파인튜닝할 수 있도록 라이브러리와 호스팅 인프라를 제공합니다.
AI 분야의 GitHub이라고 생각하시면 가깝습니다. 학과 프로젝트로 챗봇이나 이미지 분류기를 만들 때 모델을 처음부터 학습시키는 건 GPU 비용도, 데이터도 감당이 안 되는데, Hugging Face에 가면 다른 사람이 이미 학습시켜 놓은 모델 200만 개를 검색해서 두세 줄짜리 코드로 바로 가져다 쓸 수 있어요. 조별 과제할 때 노션 템플릿 골라 쓰듯, 모델 카드를 훑고 라이선스만 확인하면 그날 안에 데모까지 만들 수 있다는 점이 학부생들이 가장 먼저 만나는 이유입니다.
사내 자료실에 모델·데이터·데모를 함께 올려두는 공용 캐비닛입니다.
Transformers 라이브러리 — 사전학습 모델을 한 줄로 호출
연구실·스타트업 개발자가 BERT나 Llama 같은 모델을 from_pretrained 한 줄로 불러옵니다. arXiv 1910.03771 논문에 따르면 통합 API로 사전학습 모델을 묶어 다운스트림 작업에 바로 적용하도록 설계됐다고 명시돼 있습니다[3]. 회사 공식 트윗 기준 Transformers는 주간 활성 사용자 100만 명, 일일 pip 설치 평균 30만 건을 기록했습니다[5]. 코드 한 블록만 복붙해도 모델이 돌아간다는 점이 학습용·시제품 단계에서 가장 먼저 채택되는 이유입니다.
한국 — Upstage Solar 10.7B 글로벌 1위 + Naver HyperCLOVA X SEED 공개
Upstage가 자체 학습한 Solar 10.7B를 Hugging Face에 공개해 2023년 12월 Open LLM Leaderboard에서 사전학습 모델 부문 세계 1위를 기록했습니다. 회사 공식 발표에 따르면 Alibaba Qwen 대비 6분의 1 크기로 동급 이상 성능을 입증했고, Apache 2.0 라이선스로 상업적 활용까지 풀었다고 명시돼 있습니다[6]. 네이버도 2025년 HyperCLOVA X SEED 0.5B·1.5B·3B·8B·14B·32B 시리즈를 같은 허브의 naver-hyperclovax 조직 페이지에 올려 한국어·한국 문화 벤치마크 결과를 함께 공개했습니다[7]. 한국어 모델 생태계가 글로벌 허브 위에서 평가·재사용되는 표준 경로입니다.
Spaces 데모 — Gradio·Streamlit으로 즉시 배포
사내 PoC 단계에서 모델 데모 페이지가 필요할 때, 개발자가 Python 코드만으로 웹앱을 띄웁니다. 공식 문서에 따르면 Spaces는 Gradio·Streamlit·Docker·Static HTML 네 가지 SDK를 지원하고 DevOps 설정 없이 공유 가능한 URL이 발급된다고 명시돼 있습니다[8]. 인프라팀에 견적·결재를 올리지 않고도 시안을 외부와 공유할 수 있어, 의사결정자 데모 회의용 채널로 자리 잡았습니다.
글로벌 허브 — 모델 200만 건 돌파, 매일 1,000~2,000건 신규 등록
모델 선정 회의에서 "어느 LLM이 더 강한가" 판단할 때 허브 메타데이터와 Open LLM Leaderboard를 함께 인용합니다. arXiv 2508.06811 분석 논문에 따르면 2025년 8월 기준 공개 모델이 200만 건을 넘었고, 매일 1,000~2,000건의 신규 모델이 업로드되고 있다고 명시돼 있습니다[9]. 첫 100만 건까지 약 1,000일이 걸렸지만 200만 건까지는 335일로 단축돼, 모델 비교·후보 추리는 작업 자체가 이 허브를 거치지 않을 수 없는 단계가 됐습니다[9].
- huggingface.co/models에 접속해 Task 필터로 관심 영역(텍스트 분류·요약·이미지 생성 등) 모델 상위 5개를 훑습니다.
naver-hyperclovax또는upstage조직 페이지에 들어가 한국어 모델 카드 1건을 정독합니다 — 라이선스·학습 데이터·평가 점수 항목을 먼저 확인합니다.pip install transformers로 라이브러리를 설치하고,from_pretrained로 모델 한 개를 로컬에서 호출해 추론 결과를 확인합니다.- Open LLM Leaderboard 상위 10개 모델의 점수·파라미터 수·라이선스를 표로 비교 정리합니다.
- Spaces에서 관심 분야 데모 3개를 직접 실행해 입력·출력 품질과 응답 속도를 메모하고, 적용 후보를 의사결정자에게 1장짜리 비교표로 보고합니다.
공개 모델이라고 모두 안전한 건 아닙니다. 운영진 공식 블로그 기준 리더보드 점수가 평탄화되면서 벤치마크 누수·과적합 우려가 제기됐고, 그 결과 2024년 v2로 더 어려운 평가셋이 도입됐습니다[10]. 또한 가중치는 공개돼도 학습 데이터·라이선스 조건은 모델마다 달라 상업적 활용 전 모델 카드를 별도로 검토해야 합니다 — Solar 10.7B처럼 Apache 2.0으로 풀린 모델이 있는가 하면, 연구용·비상업 제한이 붙은 가중치도 적지 않습니다[6]. 매일 1,000~2,000건이 신규로 올라오는 만큼 품질·신뢰도가 천차만별이라, 다운로드·좋아요 수만 보고 고르면 보안 검토에서 막힐 가능성이 있다는 점도 도입 단계에서 감안할 부분입니다[9].
진화 방향은 명확합니다. CEO Clément Delangue는 2024년 미 하원 청문회와 VentureBeat 인터뷰에서 소수 빅테크 독점이 아닌 수천 개 회사가 자체 특화 모델을 만드는 분산형 AI 생태계를 전망했고, 그 흐름이 200만+ 공개 모델 등록으로 실증되고 있습니다[11][9]. 회사 공식 블로그에 따르면 Google Cloud·Microsoft Azure와 파트너십을 맺고 엔터프라이즈 배포 채널을 확장하고 있어, 오픈소스와 상용 인프라가 결합되는 흐름이 강해지고 있습니다[12]. 단순 호스팅을 넘어 평가·배포·기업용 거버넌스(SOC 2, 라이선스 자동 점검, 사설 허브)까지 묶는 방향으로 플랫폼 범위가 넓어지는 단계입니다.
- 유사 개념Fireworks AI같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.
- 유사 개념Together AI같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.
- 유사 개념Groq같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.
- Hugging Face – The AI community building the future — 회사 공식 사이트 · huggingface.co
- HuggingFace's Transformers: State-of-the-art Natural Language Processing — 학술 논문 · arXiv · 2020-07-14
- AI startup Hugging Face now valued at $4.5 billion — 권위 매체 · Axios · 2023-08-24
- 1,000,000 public models milestone achieved on Hugging Face — 회사 공식 게시물 · huggingface.co · 2024-09
- 1,500,000 public models on Hugging Face — 회사 공식 게시물 · huggingface.co · 2025-03
- Transformers weekly active users milestone — 회사 공식 트윗 · X · 2022-12
- Upstage's Solar 10.7B Emerges as World's Top Pre-trained LLM — 회사 공식 발표 · Upstage · 2023-12
- naver-hyperclovax HyperCLOVA X SEED — 공식 모델 페이지 · huggingface.co · 2025-04
- Spaces · Hugging Face — 회사 공식 문서 · huggingface.co
- Open-LLM performances are plateauing, let's make the leaderboard steep again — 회사 공식 블로그 · huggingface.co · 2024
- Hugging Face CEO tells US House open-source AI is 'extremely aligned' with American interests — 권위 매체 · VentureBeat · 2024
- Hugging Face and Google partner for open AI collaboration — 회사 공식 블로그 · huggingface.co
이 페이지에 대한 의견을 남겨주세요
여러분의 의견은 다음 갱신에 반영됩니다.