데이터·DB

Milvus

밀버스

AI 인프라 분야에서 중국 Zilliz가 2019년에 공개한 오픈소스 벡터 데이터베이스로, 수십억 단위 임베딩을 분산 처리하도록 설계된 대규모 RAG·검색·추천 인프라입니다.

쉬운 풀이

검색 증강 생성(RAG, Retrieval-Augmented Generation)을 만들 때 문서를 숫자 벡터로 바꿔 보관하고 "의미가 비슷한 자료"를 빠르게 찾아 주는 오픈소스 검색 엔진이에요. 수억·수십억 건 단위까지 다룰 수 있도록 검색·저장·색인 서버를 따로 떼어 운영할 수 있게 설계돼 있어, 한 학기 조별 과제용 소규모 챗봇부터 사내 운영 RAG까지 같은 코드로 키울 수 있습니다. 벡터 DB 비교 검토 자리에서 Pinecone·Qdrant·Weaviate와 함께 가장 자주 호명되는 이름이라, 처음 한 번 띄워 두면 이후 다른 벡터 DB를 다룰 때도 감각이 잡혀요.

한 줄 비유

사내 표준 자료실의 색인 시스템을 클라우드 규모로 확장한 것입니다.

활용 예시

Case 1

PayPal·IBM watsonx.data — 엔터프라이즈 RAG 표준 벡터 DB

PayPal은 추천 시스템에서 시작해 다국어 고객 챗봇까지 Milvus 기반으로 확장하며 "수십억 단위 임베딩 운영"을 도입 이유로 공식 사례에 명시했습니다.^[1] IBM은 사내 코드 코파일럿이 코드·문서·개발 컨텍스트를 검색하는 데 Milvus를 사용하고, 데이터 레이크하우스 제품인 watsonx.data에 통합 벡터 DB로 Milvus를 탑재해 단일 제어 평면(watsonx.data 콘솔)에서 기존 정형 데이터와 임베딩을 함께 다루도록 했습니다.^[7] 두 사례 모두 "수억~수십억 벡터를 단일 분산 클러스터에서 운영"이 핵심 채택 사유로 공개돼, 엔터프라이즈 RAG·검색 백엔드 비교 표에서 가장 자주 인용되는 레퍼런스 아키텍처입니다.^[1][7]

Case 2

SK텔레콤 DevOcean — 사내 벡터 DB 내재화 1순위 선정

SK텔레콤은 사내 RAG·검색 인프라용 벡터 DB를 오픈소스 기반으로 내재화하기로 하고, Vespa·Milvus·Qdrant 3개를 설치 용이성·사용성·성능 기준으로 비교한 끝에 Milvus를 선정했다고 DevOcean 기술블로그에서 밝혔습니다.^[8] 선정 사유로는 "이미 상용 환경에서 주요 기능과 성능이 검증되었고, 클라우드 네이티브 구조라 DevOps 운영이 가능하다"는 두 가지를 명시했습니다.^[8] 동일 블로그에는 Quick Start와 3종 비교 분석 글이 별도로 게시되어 있어, 국내 대기업이 벡터 DB 도입을 검토할 때 표준 참고 자료로 자주 인용됩니다.^[8]

Case 3

커뮤니티·고객 규모 — GitHub 4.4만 별, 운영 도입 1만 팀+

공식 저장소는 2025년 12월 GitHub 별 4만 개를 돌파했고, 2026년 6월 기준 약 4.4만 개로 오픈소스 벡터 DB 중 가장 큰 커뮤니티 규모를 유지하고 있습니다.^[1][9] Zilliz 발표에 따르면 NVIDIA·Salesforce·eBay·Airbnb·DoorDash 등 1만 팀 이상이 운영 환경에서 사용 중이며,^[9] 공식 문서는 PayPal·Shopee·IBM·AT&T·LINE·ROBLOX 등 300개 이상의 대기업이 도입했다고 명시합니다.^[1] 도입 검토 자리에서는 "엔터프라이즈 레퍼런스가 가장 두꺼운 오픈소스 옵션"이라는 점이 자주 인용됩니다.

Case 4

학계·표준화 — SIGMOD 2021 채택과 LF AI 졸업

Milvus 논문은 2021년 ACM SIGMOD에 정식 채택되어 Purdue·Zilliz 공동 연구로 발표되었고, "벡터 데이터에 특화된 관리 시스템(purpose-built vector data management system)"이라는 학술적 정의를 처음 정착시켰습니다.^[4] 같은 해 6월에는 LF AI & Data Foundation의 인큐베이션 단계를 거쳐 최상위(Graduated) 프로젝트로 졸업했고,^[3] ARM·NVIDIA·AMD·Intel·Meta·IBM·Salesforce·MS 등의 HPC 전문가들이 코어 컨트리뷰터로 참여하는 다자 거버넌스 체계로 운영되고 있습니다.^[1] 대학 RAG 실습·표준 비교 자료에서 자주 인용되는 이유는 이 학술·재단 트랙 때문입니다.

참고사항

milvus.io 공식 "What is Milvus" 페이지를 끝까지 읽고 Lite·Standalone·Distributed 3개 배포 모드 차이를 표 한 장으로 정리합니다.^[1]
pip install pymilvus로 Milvus Lite를 노트북에 띄워 1만 건짜리 컬렉션을 만들고, text-embedding-3-small 같은 모델로 사내 문서 임베딩을 적재해 봅니다.^[1]
SK텔레콤 DevOcean의 "Milvus Quick Start"와 "Vespa vs Milvus vs Qdrant" 비교 글을 읽고 사내 도입 시 점검 항목을 체크리스트로 옮깁니다.^[8]
자사 데이터 규모(현재·1년 후·3년 후)를 추정해 Standalone·Distributed 중 어느 모드가 적합한지 공식 사이징 가이드로 계산해 보고합니다.^[1]
비교 후보(pgvector·Qdrant·Pinecone)와 동일 데이터셋으로 1M 벡터 기준 QPS·지연·메모리·운영 비용을 표 한 장에 정리해 도입 결정 근거로 남깁니다.^[8]

Milvus는 운영 강점이 분명하지만 진입 장벽도 분명합니다. 분산판은 etcd·MinIO·Pulsar 등 외부 컴포넌트를 함께 운영해야 하고, 쿠버네티스 위에서 관리해야 하므로 소규모 팀에는 부담이 큽니다.^[1] 단일 머신만으로 시작하고 싶다면 Lite·Standalone이 현실적이고, 공식 문서도 "수억 벡터 이하는 Standalone, 수십억 이상은 Distributed"라는 가이드를 제시합니다.^[1] 또한 Qdrant·Vespa 등 다른 오픈소스 대비 운영 인력의 학습 곡선이 가파르다는 평가가 SK텔레콤 DevOcean 비교 글에도 언급됩니다.^[8] 임베딩 모델을 교체할 때 저장된 벡터를 전부 재계산해야 하는 점은 모든 벡터 DB의 공통 한계입니다.

진화 방향은 비용·확장성·운영 단순화에 집중되고 있습니다. 2025년 공개된 Milvus 2.6은 메모리 사용량을 72% 줄이면서 처리량을 4배까지 끌어올렸고, SQ8 정제 옵션을 함께 쓰면 95% 리콜 수준을 유지하면서 메모리를 1/4까지 절감한다고 공식 벤치마크가 보고합니다.^[10] NVIDIA와는 GPU 인덱싱(CAGRA) 지원으로 CPU 대비 최대 10배 성능 개선 사례를 공동 발표했고,^[11] 풀텍스트(BM25)·희소 벡터·하이브리드 검색을 한 컬렉션에서 다루는 멀티벡터 구조가 표준 기능으로 자리 잡았습니다.^[1] 상용 트랙에서는 Zilliz Cloud가 AWS·GCP·Azure 모두 GA에 들어와 매니지드 옵션을 함께 제공하면서, "운영 규모와 자체 호스팅이 필요해지면 Milvus, 완전 매니지드는 Zilliz Cloud"라는 단계적 채택 기준이 표준 패턴으로 굳어지는 흐름입니다.^[5][10]

이 용어와의 관계

유사 개념
pgvector같은 데이터·DB 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
Qdrant같은 데이터·DB 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
Chroma같은 데이터·DB 갈래에서 자주 함께 등장하는 개념입니다.