기본

Vector

벡터

AI 모델 분야에서 쓰이는 용어로, 단어·문장·이미지·코드의 의미를 컴퓨터가 이해하도록 압축한 숫자 묶음으로, 의미가 가까운 항목은 벡터 공간에서 거리도 가까워지도록 학습됩니다.

쉬운 풀이

벡터는 문장이나 사진처럼 사람이 쓰는 자료에 "좌표"를 매겨 두는 방법이에요. 좌표를 비슷한 자리에 찍어 두면, 컴퓨터가 "이거랑 비슷한 게 뭐지?"를 거리 계산만으로 답할 수 있습니다. 인스타가 좋아요 누른 릴스랑 비슷한 영상을 띄워 주거나 쿠팡이 본 상품과 비슷한 상품을 추천하는 게 이 원리예요. ChatGPT가 사내 매뉴얼을 읽고 답할 때도, 질문 문장을 벡터로 바꿔 뜻이 가까운 문단부터 꺼내 와 답에 쓰는 식이라 알아 두면 검색·추천·RAG 어디서나 쓸모가 많습니다.

한 줄 비유

모든 자료에 좌표를 찍어두고, 질문도 같은 좌표계에서 가까운 자리부터 꺼내는 방식입니다.

활용 예시

Case 1

OpenAI text-embedding-3 — 1k 토큰당 비용 5분의 1, MIRACL 점수 +23.5%p

OpenAI가 2024년 1월 공개한 text-embedding-3-small은 텍스트를 1536차원 벡터로 변환합니다 ^[3]. 다국어 검색 벤치마크 MIRACL 평균이 직전 ada-002의 31.4%에서 54.9%로 올랐고, 동시에 1k 토큰당 가격이 $0.0001에서 $0.00002로 떨어졌습니다 ^[1]. 결과 벡터는 길이 1로 정규화돼 있어 내적만으로도 유사도 비교가 가능해 사내 위키·고객지원 FAQ 검색 인프라에 그대로 얹기 좋습니다 ^[3]. 키워드 검색만으로 잡히지 않던 "표현이 달라도 뜻이 같은" 질문을 회수하는 데 유효합니다.

Case 2

우아한형제들 — 실시간 가게 추천 응답 100ms 이내

배달의민족 운영사 우아한형제들은 2025년 2월 기술블로그에서 사용자 관심사 임베딩과 가게 임베딩을 같은 벡터 공간에서 비교해 추천 목록을 만든다고 공개했습니다 ^[4]. 사용자가 막 반응한 가게 정보를 실시간 벡터로 바꾸고, 유사도 검색으로 후보군을 좁힌 뒤 재정렬 모델로 최종 순위를 매기는 구조입니다 ^[4]. 점심·저녁 피크 트래픽에도 일정한 응답 시간을 유지하기 위해 별도 벡터 검색 컴포넌트를 분리했다고 합니다. 이커머스·O2O·콘텐츠 추천에 그대로 응용 가능합니다.

Case 3

Spotify Voyager — Annoy 대비 약 10배 빠른 추천 백엔드

Spotify는 2013년부터 자체 라이브러리 Annoy로 사용자와 곡을 같은 벡터 공간에 배치해 가까운 곡을 찾는 구조를 운영해 왔습니다 ^[5]. 2023년 10월에는 후속 라이브러리 Voyager를 공개하면서 Annoy 대비 약 10배 빠르다고 밝혔습니다 ^[5]. Discover Weekly, Home 피드 등 핵심 추천 기능이 모두 이 벡터 검색 위에서 동작합니다. 음악·콘텐츠·미디어 추천 서비스의 표준 백엔드 구조로 참고할 수 있습니다.

Case 4

MIT·Northeastern 학계 — LLM 내부 벡터 공간에서 "참·거짓" 1방향으로 분리

2023년 10월 arXiv에 공개된 "The Geometry of Truth" 논문은 충분히 큰 LLM 내부 표현에서 참·거짓 문장이 직선적으로 분리된다는 점을 보고했습니다 ^[6]. 연구진은 잠재 공간 안의 한 방향이 "참"에 해당하고, 이 방향을 인위로 조작하면 거짓 문장을 참처럼 처리하게 만들 수 있다고 밝혔습니다 ^[6]. 벡터가 단순 검색 도구를 넘어 모델 내부 의미 구조를 해석하는 단서가 된다는 사례로, AI 안전성·거버넌스 보고서에 인용 가능한 학술 레퍼런스입니다.

오늘 바로 해보기

사내 FAQ 또는 위키 50건을 골라 OpenAI text-embedding-3-small로 벡터화해 봅니다.
코사인 유사도로 사용자 질문과 가장 가까운 FAQ를 찾는 스크립트를 작성합니다.
같은 질문을 키워드 검색·벡터 검색 두 가지로 돌려 상위 3건 적중률을 비교합니다.
Pinecone 무료 등급 또는 pgvector에 인덱스를 만들고 데이터 100배로 늘렸을 때 응답 속도를 측정합니다.
잘 잡히지 않는 질의 유형을 메모해 임베딩 모델·차원·재순위 모듈 교체 우선순위를 정리합니다.

한계와 진화

2024년 3월 arXiv에 공개된 "Is Cosine-Similarity of Embeddings Really About Similarity?" 논문은 임베딩 사이 코사인 유사도가 항상 "의미적 유사도"를 정확히 반영하지는 않으며, 학습 방식과 정규화 조건에 따라 같은 벡터쌍의 점수가 크게 달라질 수 있다고 지적했습니다 ^[7]. 같은 문장이라도 모델·차원·정규화 절차에 따라 거리가 다르게 나오므로, 단일 점수만으로 의사결정하는 것은 위험합니다. 운영에 올리기 전에 도메인 평가셋·재순위 모델·키워드 검색을 함께 두고 교차 검증하는 절차가 필요합니다. 한국어 데이터는 토크나이저 차이 때문에 영문 벤치마크 점수가 그대로 재현되지 않을 수 있다는 점도 현장에서 자주 보고됩니다. 차원 수가 늘어날수록 저장·검색 비용이 비례해 늘기 때문에, 무조건 큰 모델을 쓰기보다 도메인 적합도와 비용을 함께 보는 시각이 필요합니다.

검색 인프라 쪽에서는 2016년 Malkov·Yashunin이 제안한 HNSW 알고리즘이 사실상 표준 자리에 올라섰고, 이후 IEEE TPAMI에 정식 게재되어 대부분의 벡터 DB가 이 구조를 채택했습니다 ^[8]. 2025년 12월 Pinecone은 10억 벡터 규모에서 p50 응답 31ms를 보고하며 전용 읽기 노드(Dedicated Read Nodes) 공개 프리뷰를 발표했습니다 ^[9]. OpenAI text-embedding-3 계열은 dimensions 파라미터로 1536차원을 더 작은 차원으로 줄여도 의미 표현력이 크게 손상되지 않는 Matryoshka 구조를 채택해, 저장 비용과 검색 속도를 직접 조절할 수 있습니다 ^[3]. 응용 폭도 넓어지는 중입니다. 2023년 "Geometry of Truth" 같은 해석 가능성 연구는 벡터 공간 안의 특정 방향이 진위·감정·주제 같은 개념과 연결될 수 있다는 점을 보여주며, 단순 검색을 넘어 모델 안전성·거버넌스 영역까지 응용을 넓히고 있습니다 ^[6]. 의미·키워드 하이브리드 검색, 재순위 모듈 통합 등 운영 비용을 낮추는 방향으로 빠르게 진화하고 있습니다.

이 용어와의 관계

유사 개념
Throughput같은 기본 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
Latency같은 기본 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
SWE-bench같은 기본 갈래에서 자주 함께 등장하는 개념입니다.