데이터·DB

Weaviate

위비에이트

AI 인프라 분야에서 네덜란드 Weaviate가 2019년에 공개한 오픈소스 벡터 데이터베이스로, 임베딩과 키워드 검색을 한 번에 하이브리드 방식으로 수행하는 RAG 인프라입니다.

쉬운 풀이

검색 증강 생성(RAG, Retrieval-Augmented Generation)을 만들 때 문서를 숫자 벡터로 바꿔 보관하면서 단어 매칭과 의미 검색을 한 번에 묶어 주는 오픈소스 검색 엔진이에요. "약관 7조 위약금"처럼 정확한 단어와 비슷한 의미를 같이 찾아야 할 때, 두 방식을 alpha 값 하나로 섞을 수 있어 키워드만 찾는 검색의 빈틈을 메워 줍니다. 사내 문서·계약서·코드를 한국어와 영어가 섞인 채로 검색해야 하는 PoC에서 가장 자주 검토 후보에 오르는 이름이라, RAG를 만들 일이 한 번이라도 있다면 직접 띄워 두는 편이 좋아요.

한 줄 비유

사내 자료실에 "키워드 인덱스 + 의미 색인"을 한 책장에 같이 꽂아 둔 구조입니다.

활용 예시

Case 1

Instabase — 비정형 문서 처리 백엔드, 단일 클러스터 5만+ 테넌트

미국 엔터프라이즈 자동화 플랫폼 Instabase는 AI Hub의 벡터 DB로 Weaviate를 채택해, 450개 이상의 비정형 문서 타입을 단일 인덱스에서 처리하는 멀티테넌트 구조를 운영합니다.^[7] 공식 사례 페이지에 따르면 회사는 자체 벤치마크에서 Weaviate의 하이브리드 검색·거리 메트릭이 별도 구현 없이 내장돼 있어 검색 정확도와 지연 시간 모두에서 비교 대안 대비 우위를 보였다고 명시했고, EU 데이터 주권과 금융권 온프레미스 요건에 맞춰 자체 호스팅으로 배포할 수 있는 점을 결정 사유로 꼽았습니다.^[7] 규제 산업 대상 SaaS의 문서 검색 백엔드에 가장 자주 인용되는 레퍼런스 아키텍처입니다.

Case 2

카카오뱅크·LG CNS — 한국 금융권 RAG 검토 후보 벡터 DB

카카오뱅크 기술 블로그는 사내 LLM 도입 시 RAG 백엔드 후보로 Pinecone·Milvus와 함께 Weaviate를 비교 검토했다고 밝히며, GraphQL 쿼리 인터페이스와 자체 호스팅 가능성을 주된 장점으로 정리했습니다.^[8] LG CNS 기술 블로그도 한국어 RAG PoC에서 Weaviate의 hybrid 쿼리로 BM25 키워드와 벡터 유사도를 한 호출에 묶어 사내 문서 검색 정확도를 끌어올리는 패턴을 표준 구성으로 안내합니다.^[9] 외부 SaaS로 임베딩이나 원문을 전송할 수 없는 금융·공공 환경에서, 사내 망에 Docker/K8s로 띄워 GraphQL hybrid 한 줄로 한국어 검색을 처리하는 구조가 기본형으로 자리 잡았습니다.

Case 3

Stack Overflow OverflowAI — 5,800만+ 질문·답변 시맨틱 검색

Stack Overflow는 5,800만 건이 넘는 누적 질문·답변과 코드 스니펫을 임베딩해 OverflowAI의 시맨틱 검색 백엔드로 Weaviate를 채택했고, 공식 사례에서 회사는 "개발자가 입력한 자연어 질의에 가장 맥락이 가까운 과거 답변을 우선 노출하는 형태"로 운영한다고 밝혔습니다.^[10] 단순 키워드 매칭으로는 잡기 어려운 "에러 메시지가 다른데 원인이 같은" 사례를 묶어 보여 주는 구조이며, 사내 위키·고객 지원 로그·코드 저장소를 한꺼번에 색인해 사내 검색을 자연어로 제공해야 하는 엔터프라이즈 KMS의 표준 패턴으로 인용됩니다.^[10]

Case 4

학술·비교 — 1M 벡터·1,536차원 기준 약 1,500 QPS·30ms

2025년 다수의 벡터 DB 비교 분석에서 Weaviate(HNSW 인덱스)는 1M 벡터·1,536차원 기준 약 1,500 QPS·30ms 지연 수준으로 측정되며, Pinecone Serverless(약 2,000 QPS·50ms·네트워크 포함)·pgvector(약 800 QPS·20ms)와 함께 매니지드/자체 호스팅 양쪽을 동시에 검토할 수 있는 중간 옵션으로 정리됩니다.^[11][12] 인덱싱 알고리즘은 Malkov·Yashunin이 2016년 arXiv에 공개한 HNSW(Hierarchical Navigable Small World) 그래프 논문에 뿌리를 두고 있어, 대학·연구실 RAG 실습에서 원리 학습용 표준 백엔드로도 채택됩니다.^[13] "오픈소스 + 하이브리드 검색 + 자체/관리형 양쪽 모두"가 필요해지는 구간에서 가장 자주 호명되는 이름입니다.^[11]

참고사항

weaviate.io 공식 Quickstart 문서를 열어 Weaviate Cloud 샌드박스(무료)에 가입하거나 docker run cr.weaviate.io/semitechnologies/weaviate 한 줄로 노트북에 띄웁니다.
Python 클라이언트 weaviate-client를 설치하고 사내 문서 100건을 OpenAI text-embedding-3-small 등으로 임베딩해 컬렉션에 적재합니다.
GraphQL hybrid 쿼리에 alpha=0.5로 BM25 키워드와 벡터 유사도를 1:1로 섞어 한국어 질의 정확도를 단일·하이브리드 검색끼리 나란히 비교합니다.
같은 컬렉션에 멀티모달 벡터라이저(multi2vec-*)를 붙여 이미지·텍스트가 섞인 자료에서 한 쿼리로 두 형식을 동시에 검색해 봅니다.
동일 데이터셋을 Pinecone·pgvector·Qdrant에도 올려 1M 벡터 기준 QPS·지연 시간·메모리 사용량을 표 한 장으로 정리해 도입 결정 근거로 남깁니다.

Weaviate 자체 호스팅은 라이선스 비용을 줄여 주지만 운영 부담은 그대로 남습니다. 2025년 벡터 DB 비교 자료에서는 1,000만 벡터 이상 구간에서 샤딩·복제·HNSW 파라미터 튜닝을 사내 인력이 직접 다뤄야 하는 점이 Weaviate 자체 호스팅의 주된 비용 요인으로 지적되며, Pinecone처럼 완전 매니지드형과 비교하면 초기 학습 곡선과 SRE 공수가 크고, pgvector처럼 기존 Postgres 위에 얹는 방식과 비교하면 별도 인프라가 한 벌 더 늘어납니다.^[11] 또한 GraphQL을 1차 쿼리 인터페이스로 채택한 만큼, SQL 중심 운영팀이 새로 익혀야 할 학습 곡선이 도입 검토 단계에서 자주 거론되는 분기점입니다.^[2] 한국 시장에서는 5,000만 벡터 이상 분산 환경을 직접 운영해 본 사내 인력이 있는지가 자체 호스팅 결정의 결정적 변수로 인용됩니다.^[8][11]

진화 방향은 "단순 벡터 DB"에서 "AI 네이티브 플랫폼"으로의 확장입니다. 공식 문서는 매니지드 임베딩 추론(Weaviate Embeddings), 사전 구축된 에이전트 서비스(Weaviate Agents), Cloud 운영 도구를 하나의 생태계로 묶고 있고, 2023년 4월 Index Ventures가 주도한 5,000만 달러 시리즈 B로 확보한 자금이 이 확장 작업에 투입돼 왔습니다.^[1][5] 멀티모달 벡터라이저(multi2vec-*)·하이브리드 검색·재정렬(reranking)을 기본 모듈로 흡수해 단일 인덱스에서 텍스트·이미지·오디오를 같이 검색하는 구조도 표준 기능 영역으로 들어왔습니다.^[14] 업계에서는 보통 "오픈소스 코어 + 매니지드 클라우드 + 에이전트 레이어"의 3층 구조가 벡터 DB의 표준 형태로 자리 잡고 있다고 평가하며, Weaviate는 그 가운데 하이브리드 검색·GraphQL 인터페이스를 강점으로 내세우는 위치를 굳혀 가고 있습니다.^[11]

이 용어와의 관계

유사 개념
pgvector같은 데이터·DB 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
Milvus같은 데이터·DB 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
Qdrant같은 데이터·DB 갈래에서 자주 함께 등장하는 개념입니다.