LlamaIndex
라마인덱스
AI 개발도구 분야에서 Jerry Liu가 2022년에 공개한 오픈소스 RAG·문서 검색 프레임워크로, 사내 문서·웹·DB를 LLM이 읽을 수 있도록 인덱싱·청크·검색을 한 줄로 연결하게 해주는 도구입니다.
사내 문서·웹페이지·DB를 인공지능(AI) 모델이 읽을 수 있게 정리하고 꺼내 주는 "도서관 사서" 같은 라이브러리예요. 검색 증강 생성(Retrieval-Augmented Generation, RAG)이라는 기법을 가장 짧은 코드로 구현하도록 만들어져, PDF 한 폴더에 다섯 줄짜리 코드만 붙이면 곧장 질문 답변 챗봇이 돌아갑니다. 조별 과제로 비유하면, 흩어진 강의자료를 색인 카드로 정리해 두고 발표 직전에 필요한 카드만 꺼내 읽는 방식과 같아요. RAG 프로젝트를 시작할 때 가장 먼저 후보로 올라오는 이름이라, 한 번 익혀 두면 다른 프레임워크를 비교하는 기준점이 됩니다.
사내 문서함을 LLM이 읽을 수 있게 정리해 두는 색인 담당자입니다.
KPMG — 감사·세무 지식 에이전트의 컨텍스트 레이어
글로벌 회계법인 KPMG는 LlamaIndex를 도입해 감사·세무·자문 업무에 필요한 사내 지식을 거대 언어 모델(Large Language Model, LLM)에 공급하는 컨텍스트 레이어로 사용한다고 공식 발표했습니다.[4] KPMG LLP는 2025년 5월 LlamaIndex에 소수 지분을 직접 투자했고, 자체 AI 플랫폼에 LlamaIndex를 통합해 "정확한 컨텍스트로 의사결정을 더 빠르게" 진행한다고 밝혔습니다.[4] 비정형 문서가 많은 회계 업무 특성상, LlamaParse의 표·각주·서식 인식 능력이 채택 사유로 명시됐고, 글로벌 90개 Fortune 500 기업이 LlamaCloud 도입 대기열에 올라 있다고 같은 발표가 전했습니다.[3][4]
Carlyle·Cemex — 계약서·인보이스 자동 처리 워크플로
공식 사례 발표에서는 사모펀드 Carlyle Group, 시멘트 다국적기업 Cemex 등이 LlamaParse를 사용해 50종 이상 파일 포맷의 계약서·인보이스를 처리한다고 공개됐습니다.[8] 한 고객사는 야간 배치로 협력사 계약서를 검토해 회사에 불리한 조항을 표시하고, 계약 관리 시스템에 후속 작업을 자동 생성하는 Agentic Document Workflow를 운영합니다.[9] 표·이미지·복잡 레이아웃을 포함한 문서에서 표 인식 정확도 99%를 보고하며, 누적 5억 건 이상의 문서를 처리했습니다.[3][10]
AWS·IBM 권장 RAG 스택으로 채택
AWS는 Prescriptive Guidance 문서에서 LlamaIndex를 "RAG·에이전트 애플리케이션의 핵심 데이터 프레임워크"로 정식 안내하고 있고, IBM Think 비교 문서는 "순수 RAG는 LlamaIndex가 기본값·코드량 측면에서 단순하다"고 정리했습니다.[11][12] 동일 RAG 파이프라인을 구현했을 때 LangChain 대비 코드량이 30~40% 적다는 외부 벤치마크가 자주 인용되며, 검색 정확도 자체 벤치마크에서는 92%를 기록한 결과가 보고됐습니다.[12] 신규 RAG 프로젝트의 빠른 PoC용 표준 옵션으로 자리 잡았습니다.
한국 — 위키독스·삼성SDS 학습 생태계 구축
국내에서는 위키독스 "함께해요 파이썬 생태계 2026 개정판"이 LlamaIndex를 "RAG 프레임워크의 정석"으로 정식 챕터에 편성해 한국어 학습자 진입점으로 안착했습니다.[6] 삼성SDS 인사이트 리포트도 LlamaIndex를 RAG·문서 인덱싱 프레임워크로 소개하며 LangChain과의 영역 분담을 정리했고,[8] GitHub AgnetHub/LlamaIndex_Code 등 한국어 RAG·Agent 실습 저장소가 별도로 운영되며 Llama 3 한국어 모델을 LlamaIndex 인덱스에 붙여 사내 위키 Q&A를 만드는 패턴이 표준 예제로 정리돼 있습니다.[7] 한국어 임베딩 모델과 청킹 단계가 별도 모듈로 빠져 있어 교체가 쉽다는 점이 채택 사유로 자주 언급됩니다.[6]
pip install llama-index로 코어 패키지를 설치하고, OpenAI 또는 Anthropic API 키를 환경변수로 등록합니다.[1]- 공식 5줄짜리 스타터 예제로 PDF 한 폴더 →
VectorStoreIndex→ 질문 답변까지 한 흐름을 먼저 돌려봅니다.[13] - 표·서식이 많은 문서는
LlamaParse에 API 키를 발급받아 파싱 품질부터 비교합니다 — 표 인식 정확도 차이가 RAG 품질을 가릅니다.[10] - 한국어 문서는 한국어 임베딩 모델로 교체하고, 청킹 크기를 한국어 평균 문장 길이에 맞춰 줄여 줍니다. 위키독스 LlamaIndex 챕터 예제를 그대로 활용합니다.[6]
- 다단계 검토·외부 도구 호출이 필요해지면
Workflows 1.0모듈로 옮겨, 노드·이벤트·상태를 명시적으로 정의합니다.[9]
LlamaIndex는 RAG·문서 인덱싱에 강점이 있지만, 도구를 여럿 묶어 다단계로 의사결정하는 일반 에이전트 오케스트레이션에서는 LangChain·LangGraph 대비 추상화가 얕다는 평가가 누적돼 왔습니다.[12] IBM Think 비교 문서는 "순수 RAG는 LlamaIndex가, 복합 도구 사용 에이전트는 LangChain이 유리하다"고 정리했고, 실제 프로덕션에서는 두 프레임워크를 함께 쓰는 사례가 많다고 보고합니다.[12] 한국어 도메인에서는 임베딩 모델·청킹 전략을 별도로 튜닝해야 하고, 공식 한국어 문서·앰버서더 채널은 아직 LangChain 대비 얇다는 점이 진입 장벽으로 거론됩니다.[6]
진화 방향은 세 갈래입니다.
- 2025년 3월 시리즈 A 직후 회사가 공식 블로그에서 "더 이상 RAG 프레임워크가 아니다 — 에이전틱 문서 처리 플랫폼이다"라고 포지션을 다시 정의했고, OCR·구조화 추출·워크플로를 묶은 Agentic Document Workflow를 코어로 끌어올렸습니다.[3][9]
- LlamaCloud가 SaaS·VPC 두 형태로 정식 출시돼 RBAC·SSO 같은 엔터프라이즈 기능을 갖췄고, 1만 개 이상 조직이 도입 대기열에 올라 있습니다.[3][5]
- Databricks·KPMG의 전략 투자로 데이터 플랫폼·전문서비스 양 축에서 엔터프라이즈 채널이 정비됐고, Salesforce·Rakuten·Carlyle 같은 회사들이 공식 사용 사례로 공개됐습니다.[2][4]
- 유사 개념AI Pair Programmer같은 AI 개발도구 갈래에서 자주 함께 등장하는 개념입니다.
- 유사 개념AI IDE같은 AI 개발도구 갈래에서 자주 함께 등장하는 개념입니다.
- 유사 개념Cursor Tab같은 AI 개발도구 갈래에서 자주 함께 등장하는 개념입니다.
- LlamaIndex — AI Agents for Document OCR + Workflows — 회사 공식 사이트 · LlamaIndex · 2026
- LlamaIndex launches a cloud service for building unstructured data agents — 권위 매체 · TechCrunch · 2025-03-04
- LlamaIndex is more than a RAG Framework. It is Agentic Document Processing. — 회사 공식 블로그 · LlamaIndex · 2025
- LlamaIndex Welcomes Investments from Databricks and KPMG — 회사 공식 블로그 · LlamaIndex · 2025-05-01
- Series A Funding And LlamaParse GA Update — 회사 공식 블로그 · LlamaIndex · 2025-03
- LlamaIndex: 데이터를 AI의 지식으로 바꾸는 RAG 프레임워크의 정석 — 함께해요 파이썬 생태계 2026 개정판 — 권위 출판물 · 위키독스 · 2026
- LlamaIndex_Code — 라마인덱스를 이용한 RAG & Agent 구현 — 1차 출처 · GitHub · AgnetHub · 2024~2025
- LlamaParse — AI Document Parsing, Extraction & Indexing Software — 제품 공식 문서 · LlamaIndex · 2026
- Introducing Agentic Document Workflows — 회사 공식 블로그 · LlamaIndex · 2025
- LlamaParse Document Automation: One-Year Update — 회사 공식 블로그 · LlamaIndex · 2025
- LlamaIndex — AWS Prescriptive Guidance: Agentic AI Frameworks — 1차 출처 · AWS 공식 문서 · 2025
- LlamaIndex vs LangChain: What's the difference? — 권위 매체 · IBM Think · 2024
- High-Level Concepts — LlamaIndex Developer Documentation — 제품 공식 문서 · LlamaIndex · 2026
- LlamaIndex Secures $19 Million Series A — 권위 매체 · PR Newswire · 2025-03-04
이 페이지에 대한 의견을 남겨주세요
여러분의 의견은 다음 갱신에 반영됩니다.