AI 트렌드

Repository Intelligence

레포지토리 인텔리전스

AI 활용 개발 분야에서 쓰이는 용어로, AI 코딩 도구가 단일 파일이 아니라 전체 코드베이스의 구조·관계·관례를 미리 읽어 두고 답하는 능력을 가리키는 표현입니다.

쉬운 풀이

리포지토리 인텔리전스는 AI 코딩 도구가 지금 열어 둔 파일 한 개만 보고 답하지 않고, 프로젝트 전체를 통째로 한 번 읽어 둔 다음 답해 주는 능력이에요. 조별 과제에서 회의록·발표 자료·참고 문헌을 다 본 조원과, 자기 분량만 본 조원이 회의에서 내놓는 답의 깊이가 다른 것과 비슷합니다. 사내 코딩 컨벤션이나 같은 함수를 다른 어디서 또 쓰고 있는지까지 알고 있어야, "이 함수 고쳐도 되나요?" 같은 질문에 영향 범위까지 짚어서 제대로 답할 수 있어요.

한 줄 비유

신규 외주사가 들어오자마자 전사 결재 라인을 한 번에 파악한 상태입니다.

활용 예시

Case 1

Lyft — PHP 모놀리스 → 마이크로서비스 사내 최대 리팩터링

Sourcegraph 공식 케이스 스터디는 Lyft가 다중 리포지토리 코드 검색을 활용해 PHP 모놀리스에서 마이크로서비스로 전환하는, 자사 역사상 가장 큰 리팩터링을 수행했다고 밝혔습니다.^[5] 함수 한 개의 호출 지점을 수십 개 서비스에서 동시에 찾아내야 하는 작업입니다. 같은 페이지는 Nutanix가 Log4j 취약점을 코드베이스 전체에서 일괄 수정한 사례도 함께 소개합니다.^[5]

처리 기간: 1주 이내 (Sourcegraph 공식 페이지 명시, 도입 전 다중 리포지토리 수동 검색 대비).^[5]
핵심 효과: 함수 호출 지점·취약 패턴을 전사 단일 인터페이스에서 추적 가능.

Case 2

카카오페이 AI 플랫폼팀 — 후반부 환각을 막는 통제 레이어

카카오페이 AI 플랫폼팀은 2026년 3월 기술 블로그에서 에이전틱 코딩이 후반부로 갈수록 "맥락을 잃고 일관성 없는 코드를 곳곳에 만들어 낸다"고 보고했습니다.^[6] 원인 중 하나는 코드베이스 전반에 대한 이해가 세션 도중 흐려지는 것이었고, 팀은 헌법 → 스펙 → 계획 → 작업 단계로 컨텍스트를 분할 주입하는 Spec-kit을 도입했습니다.^[6] 신규 멤버 온보딩 시간 단축에도 같은 구조가 활용됐다고 설명합니다.^[6]

처리 기간 단축: 컨텍스트 분할 주입 도입 후 구축 기간 단축 보고 (정량치는 비공개, 정성 평가 기준).^[6]
핵심 효과: 후반부 환각·일관성 붕괴 감소 — 헌법/스펙/계획 3단 통제 레이어로 코드베이스 이해를 세션 끝까지 유지.^[6]

Case 3

CERN — 1,500만 라인 Java 코드베이스 단일 검색

Sourcegraph는 CERN이 1,500만 라인 Java 코드베이스를 Sourcegraph로 운영한다고 공식 페이지에 명시했습니다.^[5] 입자물리 실험 코드처럼 수십 년 누적된 레거시는 신규 연구자가 "이 시뮬레이션 함수가 어디서 쓰이는지" 한 번에 찾기 어렵습니다. 검색·정의 이동·참조 추적이 단일 인터페이스에서 가능해지자 신규 합류자의 적응 시간이 줄었다고 보고됐습니다.^[5]

처리 기간 단축: 신규 연구자 적응 시간 단축 보고 (정량치 비공개, 정성 평가 기준).^[5]
핵심 효과: 수십 년 누적 레거시에서도 정의·참조·심볼을 단일 인터페이스로 동시에 탐색.

Case 4

Anthropic 공식 가이드 — "harness가 모델만큼 중요"

Anthropic은 2026년 5월 "How Claude Code works in large codebases" 가이드에서, 백만 라인급 모노레포에서 Claude Code가 잘 동작하려면 모델 자체보다 CLAUDE.md·skills·hooks·플러그인·MCP(Model Context Protocol, 모델 컨텍스트 프로토콜)·LSP·서브에이전트로 구성된 harness가 핵심이라고 정리했습니다.^[3] 특히 LSP 통합으로 grep 대신 심볼 단위 탐색을 쓰게 만들면 C·C++ 같은 멀티 언어 환경에서 정확도가 크게 올라간다고 밝혔습니다.^[3] arXiv 2025년 서베이는 같은 흐름을 "selective retrieval"이라 부르며, RAG 결과의 최대 80%가 오히려 모델을 방해한다는 실증 결과를 인용합니다.^[4]

처리 품질 향상: LSP 기반 심볼 탐색이 grep 단순 검색 대비 멀티 언어 환경에서 정확도 향상 보고 (정성 평가, 공식 가이드 기준).^[3]
핵심 효과: 인덱스를 따로 만들지 않고도 harness 구성만으로 대규모 코드베이스 컨텍스트 유지.

참고사항

Sourcegraph 공개 인스턴스에 접속해 자주 쓰는 오픈소스 프로젝트의 함수 한 개를 "find references"로 추적해 봅니다.
Cursor 또는 Claude Code에 자기 프로젝트 루트를 열고, "이 코드베이스의 폴더 구조와 핵심 모듈을 한 페이지로 정리해 줘"라고 지시합니다.
Anthropic 가이드를 참고해 프로젝트 루트에 CLAUDE.md를 만들고, 빌드·테스트·금지 사항만 5줄 안쪽으로 정리합니다.
.gitignore에 빠진 생성 파일·서드파티 코드가 인덱스에 섞이지 않게 .claudeignore 또는 .cursorignore에 명시합니다.
동일한 리팩터링 과제를 인덱스 기반(Cursor)과 에이전트 탐색(Claude Code)에 각각 시켜 결과를 비교하고 적합한 쪽을 선택합니다.

완전한 정답은 아직 없습니다. Sourcegraph는 임베딩 기반 검색을 한때 도입했다가 "10만 리포지토리 이상에서 벡터 DB 유지 비용이 커지고, 코드를 외부 임베딩 API로 보내야 하는 부담이 있다"는 이유로 2024년 BM25 변형 검색으로 되돌아갔다고 공식 블로그에 밝혔습니다.^[1] Anthropic은 반대로 인덱스 자체를 만들지 않는 방식을 택했는데, 이는 코드베이스가 자주 바뀌는 환경에 강하지만 모호한 질의에는 컨텍스트 한계를 빠르게 소진한다고 같은 가이드에서 인정합니다.^[3] arXiv 2025년 서베이는 표준 RAG 검색 결과의 최대 80%가 강력한 코드 LM의 성능을 향상시키지 않거나 오히려 떨어뜨린다고 보고합니다.^[4]

진화 방향은 세 갈래로 정리됩니다.

"선택적 검색(selective retrieval)" — Repoformer·CodeRAG 등 arXiv 2024~2025년 논문들은 모든 질의에 검색을 거는 대신 필요한 순간에만 호출하는 구조로 옮겨가고 있습니다.^[4]
"심볼·그래프" 우선 — Anthropic은 grep을 LSP·코드 그래프로 보강하는 것이 멀티 언어 모노레포에서 가장 큰 투자 수익이라고 명시했고, Sourcegraph도 Code Graph 기반 정의·참조 추적을 핵심 자산으로 유지합니다.^[1][3] GitHub Copilot도 워크스페이스에 대해 시맨틱 인덱스를 자동으로 구축·유지한다고 공식 문서에 명시했습니다.^[8]
한국 시장 — 카카오페이의 Spec-kit 사례처럼 인덱스·에이전트 위에 사양·헌법 같은 통제 레이어를 얹는 방식이 엔터프라이즈 도입의 표준이 되어가고 있습니다.^[6]

이 용어와의 관계

유사 개념
Adaptive Reasoning같은 AI 트렌드 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
Extended Thinking같은 AI 트렌드 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
Prompt Caching같은 AI 트렌드 갈래에서 자주 함께 등장하는 개념입니다.