기본

LLM

AI 모델 분야에서 쓰이는 Large Language Model(거대 언어 모델)의 약자로, 수천억 단어의 텍스트를 미리 학습해 사람의 질문에 자연스럽게 답할 수 있도록 만든 대규모 인공지능 모델입니다.

쉬운 풀이

LLM은 Large Language Model, 우리말로는 "거대 언어 모델"이에요. 인터넷에 떠다니는 책, 위키, 뉴스, 코드까지 수천억 단어를 미리 다 읽어 둔 다음, 사람이 질문을 던지면 다음에 올 말이 무엇일지 한 글자씩 골라 가며 문장을 만들어 줍니다. 대학교 1학년이 시험 전날 족보 수천 권을 통째로 외워 둔 선배에게 "이 챕터 핵심만 정리해 줘"라고 물으면 술술 답이 나오는 모습과 비슷해요. ChatGPT나 Claude처럼 우리가 매일 쓰는 AI 비서가 모두 LLM 위에서 돌아가니까, 지금 AI 시대를 이해하려면 가장 먼저 알아야 하는 단어입니다.

한 줄 비유

방대한 사내 문서를 다 읽어 둔 만능 신입사원의 검토 의견서.

활용 예시

Case 1

OpenAI · Klarna — 글로벌 핀테크의 고객 상담 LLM 전환

스웨덴 핀테크 Klarna는 2024년 2월 OpenAI 기반 LLM 챗봇을 글로벌 23개 시장·35개 언어로 배포했습니다. 출시 한 달 만에 전체 고객 상담의 약 3분의 2(약 230만 건)를 LLM이 자율 처리했고, 평균 응답 시간이 사람 상담 대비 9분 줄었습니다.^[4] 단순 환불·주문 조회처럼 표준화된 문의에서는 만족도가 사람과 동등 수준이었습니다. 대량의 표준 문의를 24시간 다국어로 처리해야 하는 콜센터·CX팀에 적용 지점이 있습니다.

Case 2

LG AI연구원 — Exaone 4.0 한국형 오픈 웨이트 LLM

LG AI연구원은 2025년 7월 한국 최초의 오픈 웨이트 하이브리드 LLM "Exaone 4.0"을 Hugging Face에 공개했습니다. 32B 중형 모델과 1.2B 온디바이스 모델 두 종으로 나오며, 일반 지식 벤치마크 MMLU-Redux에서 92.3점을 기록해 한국어·영어 양쪽에서 글로벌 상위권에 진입했습니다.^[5] 1.2B 소형 모델은 OpenAI GPT-4o mini를 수학·코드·과학 평가에서 앞섰습니다.^[5] 사내 보안 문제로 클라우드 LLM을 쓰기 어려운 한국 대기업·공공기관이 사내 인프라에 띄워 쓸 수 있는 선택지가 늘었습니다.

Case 3

네이버 — HyperCLOVA X 한국어 LLM 기업용 공급

네이버는 2024년 4월 한국어에 특화된 LLM "HyperCLOVA X DASH"를 출시했습니다. 파라미터를 약 40% 줄이면서도 핵심 한국어 평가를 통과하도록 설계해, 기업 입장에서는 가격을 5분의 1 수준으로 낮춰 도입할 수 있게 됐습니다.^[6] 네이버는 이후 신모델 운영 비용이 기존 대비 50% 이상 개선됐다고 공시했습니다.^[6] 한국어 고객 응대·문서 요약·내부 검색 챗봇에 적합한 선택지입니다.

Case 4

Stanford HAI — "파운데이션 모델" 학술 정립

2021년 Stanford HAI 산하 CRFM 연구진(Rishi Bommasani 외 100여 명)은 LLM 같은 대규모 사전학습 모델을 "파운데이션 모델"이라 명명한 보고서를 arXiv에 공개했습니다. 한 모델이 번역·요약·코딩·QA·이미지 캡셔닝 등 다양한 응용으로 갈래쳐 쓰인다는 점을 학술적으로 정리해, 이후 산업·정책 논의의 공통 어휘가 됐습니다.^[3] 보고서는 26개 섹션, 약 200쪽 분량으로 "능력·응용·기술·사회" 4부 구성을 따릅니다.^[3] 대학 수업·기업 내부 교육에서 LLM 개요 교재로 자주 인용됩니다.

참고사항

ChatGPT·Claude·Gemini 중 하나에 가입해 "방금 회의록 3쪽을 5줄로 요약해 줘" 같은 실무 프롬프트를 시도합니다.
같은 질문을 두 LLM에 던져 답변을 나란히 비교합니다. 어느 쪽이 더 사실에 가까운지, 어디서 환각(hallucination)을 일으키는지 표로 정리합니다.
Hugging Face에서 Llama 3·Exaone·Mistral 같은 오픈 웨이트 모델 카드를 1개 읽고, MMLU·HumanEval 등 벤치마크 수치를 직접 확인합니다.
내 업무에서 LLM이 잘하는 일(요약·번역·초안 작성)과 못 하는 일(최신 정보·수치 계산·법률 판단)을 각 3가지씩 정리합니다.
사내 도입을 검토한다면 비용·보안·환각률 세 항목으로 클로즈드/오픈 LLM을 비교하는 간단한 표를 작성합니다.

LLM의 핵심 약점은 환각(hallucination, 학습하지 않은 사실을 그럴듯하게 지어내는 현상)과 학습 시점 이후 정보 부재입니다. Wikipedia 정리에 따르면 LLM은 학습 데이터에 없는 최신 사건·내부 문서·수치 계산에서 자주 틀리고, 학습 코퍼스에 담긴 편향(bias)을 그대로 답변에 노출할 수 있습니다.^[1] Stanford HAI 보고서도 "파운데이션 모델은 한 번의 결함이 모든 응용으로 전파된다"고 지적하며, 모델 위에 안전·감사 체계가 함께 들어가야 한다고 강조했습니다.^[3]

진화 방향은 크게 세 갈래입니다.

외부 검색·도구를 답변 전에 호출하는 검색 증강 생성(RAG, Retrieval-Augmented Generation)·도구 사용(Tool Use)으로 환각을 줄이는 방향입니다.
같은 모델 크기로 더 높은 정답률을 내는 추론(reasoning) 모델 — OpenAI o-시리즈·Anthropic Extended Thinking·LG Exaone 4.0 같은 사례가 대표적입니다.^[5][8]
1~3B급 소형 모델을 노트북·휴대폰에서 돌리는 온디바이스 LLM 방향입니다. LG Exaone 4.0 1.2B가 GPT-4o mini를 수학·코드 평가에서 앞선 것이 대표 사례입니다.^[5] 산업 전반에서는 클로즈드 모델(OpenAI·Anthropic·Google)과 오픈 웨이트 모델(Meta Llama·Mistral·Exaone·HyperCLOVA X) 두 축이 병행 발전하는 흐름이며, 한국 정부도 2025년 자체 LLM 개발에 2,400억 원 규모의 사업을 편성해 네이버클라우드·SK텔레콤·업스테이지·LG AI연구원·NC AI 5개 컨소시엄을 지원하기 시작했습니다.^[7]

흐름

2017

Transformer

구글 논문 "Attention Is All You Need"로 LLM 시대의 토대 마련.

2020

GPT-3

175B 파라미터로 few-shot 학습 능력을 입증한 첫 초거대 모델.

2022

ChatGPT

대화형 인터페이스로 LLM이 대중에게 본격 확산.

2024—

추론 모델

답을 내기 전 단계적으로 생각하는 reasoning 모델 등장.

이 용어와의 관계

기반 기술
TransformerLLM이 올라타는 핵심 신경망 구조
유사 개념
SLM더 작고 가벼운 소형 언어 모델
다음 단계
Reasoning Model답 전 단계별 사고를 거치는 진화형
다음 단계
Multimodal텍스트 외 이미지·음성까지 확장한 모델
대표 도구
Fine-tuning범용 LLM을 특정 도메인에 맞추는 방법

LLM vs SLM

LLMSLM

파라미터 규모수십~수천억 개수억~수십억 개

실행 환경클라우드 GPU 서버노트북·모바일·엣지

비용토큰당 과금 높음낮거나 무료(온디바이스)

성능 범위범용·복잡한 추론특정 작업에 최적화

쓰는 곳ChatGPT, Claude, Gemini사내 도구·온디바이스 비서