Vector DB
벡터 데이터베이스
AI 인프라 분야에서 쓰이는 용어로, 텍스트·이미지·코드를 숫자 벡터로 바꿔 저장한 다음 의미가 비슷한 벡터를 빠르게 찾아 주도록 설계된 데이터베이스로, RAG·시맨틱 검색·추천 시스템의 기반이 됩니다.
벡터 DB는 글·그림·코드 같은 자료를 "의미가 비슷한지"로 검색할 수 있게 숫자 벡터 형태로 모아 두는 데이터베이스예요. 도서관에 비유하면, 일반 데이터베이스는 책 제목으로만 찾는 카드 목록이라면, 벡터 DB는 "이 책이랑 분위기 비슷한 책"을 한 번에 골라 주는 서가 배치 시스템에 가깝습니다. ChatGPT 같은 모델에 사내 문서를 붙여 답하게 하려면, 질문 의미와 가까운 문서 조각을 빠르게 찾아 줄 도구가 필요한데 그 자리에 들어가는 부품이에요. 사내 매뉴얼 챗봇, 추천 시스템, AI 검색이 모두 이 구조 위에 올라간다고 알아 두면 쓸모가 많습니다.
같은 자료실을 외주·사내 구축·데스크탑·ERP 확장 중 어디에 맡길지의 문제입니다.
매니지드 — Pinecone, Notion Q&A 백엔드 인프라 비용 60% 절감
Pinecone은 인프라 운영 없이 API만으로 수십억 벡터 인덱스를 다루는 완전관리형 벡터 DB입니다 [3]. Notion은 자사 워크스페이스 Q&A AI의 검색 인프라로 Pinecone 서버리스를 채택했고, 공식 사례에 인프라 비용이 60% 줄었다고 명시되어 있습니다 [8]. 운영 인력이 부족하고 트래픽이 들쭉날쭉한 SaaS·B2C 환경에 적합한 옵션입니다.
자체 호스팅 — SK텔레콤 데보션, Milvus·Qdrant·Vespa 비교 검토
SK텔레콤 기술 블로그 데보션은 자사 RAG(Retrieval-Augmented Generation, 검색 증강 생성) 시스템 후보로 Vespa·Milvus·Qdrant를 비교 검토한 내용을 공개했습니다 [4]. 동일 블로그는 LangChain 초기 도입이 Pinecone에서 시작했으나, 데이터가 늘면서 비용·성능 부담이 커져 Milvus로 전환한 사례를 언급합니다 [4]. 오픈소스 자체 호스팅은 라이선스 비용이 없는 대신 쿠버네티스 운영과 인덱스 튜닝 공수를 사내가 떠안는 트레이드오프가 명확합니다 [4]. 데이터 주권·보안 요건이 강한 통신·금융·공공 사내 시스템에 자주 채택됩니다.
임베디드 — Chroma, 로컬 프로토타이핑 표준
Chroma는 Python·JavaScript 애플리케이션 안에 라이브러리처럼 들어가 로컬 디스크에 벡터를 저장하는 임베디드 벡터 DB입니다 [5]. 별도 서버를 띄우지 않고 pip install chromadb 한 줄로 시작할 수 있어, 사내 PoC(Proof of Concept, 개념 검증)·해커톤·노트북 데모용으로 자주 선택됩니다 [5]. 데이터 수만 건 수준에서는 50밀리초 이하 응답이 일반적이며, 같은 API로 클라이언트-서버 모드 전환도 됩니다 [5]. RFP 단계에서 "동작하는 데모 먼저"가 필요한 초기 프로젝트에 맞는 구조입니다.
Postgres 확장 — pgvector, p95 지연 시간 28ms로 Pinecone 대비 96% 단축
pgvector는 PostgreSQL에 vector 컬럼 타입을 추가하는 오픈소스 확장으로, 별도 벡터 DB를 띄우지 않고 SQL 한 줄로 유사도 검색을 처리합니다 [6]. 2026년 공개된 한국어 특화 오픈소스 RAG 시스템 UrstoryRAG는 pgvector 벡터 검색과 Elasticsearch Nori 한국어 형태소 분석을 결합한 하이브리드 구조를 표준 아키텍처로 채택했습니다 [9]. JustSoftLab 2025년 5월 벤치마크는 5천만 벡터·1536차원·재현율 99% 조건에서 pgvector p95 28ms, Pinecone s1 p95 784ms, 월 비용은 자가 호스팅 약 $835 대 Pinecone 약 $3,241을 기록했다고 보고했습니다 [10]. 이미 Postgres가 사내 표준 DB라면 진입 비용이 가장 낮은 옵션입니다.
- 데이터 규모와 운영 인력을 먼저 정합니다 — 수만 건·1인 개발은 Chroma, 수백만 건·인력 부족은 Pinecone부터 시작합니다 [2].
- 이미 Postgres가 사내 표준이라면
CREATE EXTENSION vector;로 pgvector를 활성화해 별도 인프라 도입을 생략합니다 [6]. - 데이터 주권·온프레미스 요건이 강하면 Weaviate·Milvus·Qdrant 중 하나를 PoC로 띄워 비교합니다 [4].
- 인덱스는 HNSW로 잡고, 데이터셋 절반을 평가셋으로 분리해 재현율·p95 지연을 동시에 측정합니다 [7].
- 도입 결정 전 반드시 한국어 임베딩 모델·BM25 토크나이저(Nori)로 도메인 평가셋에서 하이브리드 검색 정확도를 검증합니다 [9].
"벡터 DB"라는 약칭은 하나의 제품군처럼 들리지만, 운영 방식이 매니지드·자체 호스팅·임베디드·확장형으로 갈리면서 비용·성능 곡선이 전혀 다릅니다 [2]. Pinecone 같은 매니지드는 초기 구축이 빠른 대신 데이터·트래픽이 커질수록 청구액이 가파르게 늘고, SK텔레콤 데보션은 Pinecone이 비용·성능 부담으로 Milvus 전환을 검토한 사례를 공개적으로 기록하고 있습니다 [4]. 반대로 자체 호스팅은 라이선스 비용은 0원이지만, 5천만 벡터 이상 구간에서 샤딩·복제·인덱스 튜닝을 직접 다뤄야 합니다 [4]. 임베디드형 Chroma는 단일 노드 한계가 있어 멀티테넌트 SLA에는 부적합하고, pgvector는 5천만 행을 넘기면 pgvectorscale 같은 보완 확장 검토가 필요해집니다 [10].
진화 방향은 세 갈래로 보입니다.
- 키워드 검색(BM25)과 벡터 검색을 함께 쓰는 하이브리드가 표준에 가까워지고 있습니다 — 한국어처럼 조사·어미가 의미를 바꾸는 언어에서는 특히 필수입니다 [9]. 정확한 제품명·코드·법령 조항이 들어간 질의는 벡터만으로 잡기 어렵기 때문입니다.
- 기존 관계형 DB·검색엔진(Postgres·Elasticsearch·MongoDB)이 벡터 컬럼을 흡수하면서, 별도 전용 벡터 DB를 두지 않는 선택지가 늘고 있습니다 [6]. 신규 RAG 프로젝트가 별도 인프라 한 벌을 추가하지 않고 시작하는 비중이 커지는 흐름입니다.
- 매니지드 진영은 "에이전트용 장기 기억 인프라"로 포지션을 옮겨, 임베딩 추론·하이브리드 검색·재정렬을 하나의 스택으로 묶고 있습니다 [3]. 업계에서는 보통 "데이터 규모·운영 인력·기존 스택" 세 축으로 네 옵션 중 하나를 고르는 흐름이 자리 잡고 있다고 평가합니다 [2].
- What is a Vector Database? — 회사 공식 학습 자료 · Pinecone · 2023
- How do I choose between Pinecone, Weaviate, Milvus, and other vector databases? — 회사 공식 비교 가이드 · Milvus / Zilliz · 2025
- Reimagining the vector database to enable knowledgeable AI — 공식 기술 블로그 · Pinecone · 2024
- RAG 시대, Vector DB 비교 가이드: Vespa vs Milvus vs Qdrant — 회사 공식 기술 블로그 · SK텔레콤 데보션 · 2024
- What Is Chroma? An Open Source Embedded Database — 권위 매체 기술 설명 · Oracle · 2024
- AI & Vectors — Supabase Docs — 회사 공식 문서 · Supabase · 2025
- Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs (Malkov & Yashunin) — 학술 논문 · arXiv / IEEE TPAMI · 2018
- Pinecone reinvests hours saved from using Notion AI — 고객 사례 공식 페이지 · Notion · 2024
- urstory-rag: 한국어 특화 프로덕션 RAG 시스템 (PGVector + Elasticsearch Nori) — 오픈소스 저장소 README · GitHub · 2026
- Postgres + pgvector vs Pinecone: A Production Benchmark to 50M Vectors — 벤치마크 보고서 · JustSoftLab · 2025-05
이 페이지에 대한 의견을 남겨주세요
여러분의 의견은 다음 갱신에 반영됩니다.