AI 트렌드

Subagent

서브에이전트

메인 에이전트가 특정 작업을 위해 별도로 호출하는, 격리된 컨텍스트와 권한을 가진 보조 AI 에이전트입니다.

쉬운 풀이

서브에이전트는 메인 AI(Artificial Intelligence, 인공지능)가 자기 일부를 다른 작은 AI에게 외주 주는 방식이에요. 조별 과제로 비유하면, 조장이 자료 조사·발표 자료·참고문헌 정리를 각각 다른 팀원에게 나눠 맡기고 결과만 받아 합치는 모습이 가깝습니다. 메인 에이전트는 큰 그림만 보고, 서브에이전트는 자기 작업만 좁게 보기 때문에 한 번에 너무 많은 정보를 떠안지 않아도 됩니다. 코드 리뷰·테스트 작성·문서 탐색처럼 "정해진 한 가지 일"이 반복될 때 알아 두면 쓸모가 많아요.

한 줄 비유

한 안건을 여러 외주팀에 동시 발주해 보고서만 받아 합치는 PM의 일과 같습니다.

활용 예시

Case 1

Anthropic Research — 리서치 서브에이전트로 단일 모델 대비 우위

Anthropic은 Claude.ai의 Research 기능을 멀티에이전트 구조로 운영합니다. Lead Researcher가 질의를 분해해 3~5개의 서브에이전트를 병렬로 띄우고, 각 서브에이전트는 도구 3개 이상을 동시에 호출해 정보를 모읍니다.^[03] 내부 리서치 평가에서 Lead=Opus 4, Subagent=Sonnet 4 구성이 단일 Opus 4 대비 우위를 기록했고, 복잡 질의 처리 시간도 크게 단축됐다고 보고했습니다.^[03] S&P 500 IT 기업 이사회 명단처럼 폭넓은 조회 업무가 적용처입니다.

Case 2

컬리 — 코드 리뷰·도메인 탐색 서브에이전트 4종 병렬 운영

컬리 기술 블로그(2025년 12월)는 Claude Code의 Explore 서브에이전트로 한 코드베이스를 인증·결제·알림·검색 4개 도메인으로 쪼개 동시에 탐색한 로그를 공개했습니다.^[04] 인증 도메인은 26.0k 토큰·도구 호출 9회, 결제 14.7k·6회, 알림 15.9k·4회, 검색 14.8k·7회로 각각 자기 컨텍스트 안에서 작업을 마쳤습니다.^[04] Lost in the Middle(긴 컨텍스트 중간 정보가 무시되는 현상)을 분리된 작은 컨텍스트로 우회한 사례입니다. 사내 코드 컨벤션 파악, 영향도 분석 같은 작업이 적용처입니다.

Case 3

코드 리뷰 전용 서브에이전트 — 허용 도구 4종으로 권한 축소

Anthropic 공식 문서는 서브에이전트 활용처로 "특정 도메인에 특화된 시스템 프롬프트와 제한된 도구 셋"을 들고, 코드 리뷰용으로는 Read·Grep·Glob·Bash만 허용하고 Write·Edit는 빼서 읽기 전용으로 운영하는 방식을 권장합니다.^[01] 메인 에이전트가 코드를 수정한 직후 자동으로 리뷰 서브에이전트에 위임되도록 description을 작성하는 패턴이 일반적입니다.^[01] 보안 검토·스타일 검사처럼 "쓰기 권한 없이도 충분한" 검증 단계가 적용처입니다. 같은 방식으로 테스트 작성 서브에이전트도 Read·Edit·Bash만 허용해 테스트 코드만 건드리도록 분리할 수 있습니다.^[01]

Case 4

Microsoft AutoGen — 학계의 멀티에이전트 표준화 1차 출처

Microsoft Research가 발표한 AutoGen(arXiv 2308.08155, COLM 2024 채택)은 대화 가능한 에이전트 여러 대를 조합해 한 작업을 푸는 오픈소스 프레임워크입니다.^[02] 수학 문제 풀이, 코드 작성, 운영 리서치, 온라인 의사결정 등 6개 도메인에서 단일 에이전트 대비 성능 개선 사례를 보고했습니다.^[02] "수학 풀이 담당", "코드 검증 담당"처럼 도메인 전문 서브에이전트를 명시적으로 설계할 때 인용 가능한 1차 학술 출처입니다. 한국에서도 KAIST·서울대 등 연구실 발표 자료에 같은 논문이 멀티에이전트 시스템 기준 문헌으로 인용되고 있습니다.^[02]

오늘 바로 해보기

Claude Code에서 /agents 명령으로 기본 서브에이전트(Explore, Plan 등)를 둘러봅니다.
.claude/agents/ 폴더에 code-reviewer.md 한 장을 만들고 name·description·tools 항목을 채워 봅니다.
도구 목록에서 Write·Edit를 빼고 Read·Grep·Glob·Bash만 남겨 읽기 전용으로 권한을 좁힙니다.
description에 "코드 수정 직후 자동 사용"이라고 적어 자동 위임을 유도하거나 @code-reviewer로 명시 호출합니다.
큰 코드베이스 탐색이 필요할 때 도메인별로 서브에이전트 3~4개를 병렬로 띄워 토큰 사용량과 소요 시간을 비교합니다.

한계와 진화

Anthropic이 공개한 같은 글에 한계도 함께 적혀 있습니다. 멀티에이전트 시스템은 단일 채팅 대비 약 15배, 일반 에이전트 대비 약 4배의 토큰을 소모하므로 가치가 높은 작업에만 적합합니다.^[03] 모든 에이전트가 동일한 컨텍스트를 공유해야 하거나 에이전트 간 의존이 강한 작업, 예컨대 일반 코딩 업무에는 잘 맞지 않는다고 적시했습니다.^[03] 초기 시스템에서는 단순 질의에 50개 서브에이전트를 띄우거나 존재하지 않는 출처를 무한 검색하는 실패 사례도 보고됐고, 이는 프롬프트 가드레일로 보정해야 한다고 밝혔습니다.^[03] 컬리 사례에서도 도메인 4개가 동시에 같은 파일을 만지면 결과를 합칠 때 충돌이 생긴다는 운영 보고가 함께 정리됐습니다.^[04]

진화 방향은 비동기 실행과 컨텍스트 핸드오프로 이동하고 있습니다. 현재 Lead 에이전트는 서브에이전트 결과를 동기적으로 기다리는 구조여서 한 서브에이전트가 느려지면 전체가 멈춥니다.^[03] Anthropic은 비동기 실행, 결과 좌표 전달, 파일 시스템 기반 산출물 전달 등으로 병목을 풀어가는 중이라고 밝혔습니다.^[03] Claude Code 쪽에서는 백그라운드 에이전트(여러 세션 병렬 실행)와 에이전트 팀(세션 간 통신) 기능이 별도로 분리돼 발전하고 있어, 한 세션 안의 서브에이전트와 세션 간 협업이 점차 다른 축으로 갈라지는 추세입니다.^[01] 학계에서는 AutoGen 이후 LangGraph·CrewAI 같은 오픈소스 프레임워크가 그래프 기반 워크플로우와 역할 기반 팀 구성을 표준화하며 후속을 이어가고 있습니다.^[02] Anthropic SDK 쪽에서는 서브에이전트를 API 수준에서 직접 정의·호출할 수 있도록 Subagents in the SDK 문서가 별도로 분리돼, 사내 백오피스 자동화 같은 비코딩 적용처도 빠르게 늘어나는 흐름입니다.^[05]