프롬프트·AI 활용

Tool Use

툴 유즈

AI 활용 분야에서 쓰이는 용어로, LLM이 답변 도중 사람이 등록해 둔 외부 도구·API·코드를 호출해 정보를 가져오거나 작업을 처리하도록 만든 일반 능력을 가리키는 표현입니다.

쉬운 풀이

Tool Use는 LLM이 답하는 도중 "이건 내가 직접 모르니까 등록된 외부 함수를 한 번 불러봐야겠다"라고 판단해 정해진 형식으로 호출 요청을 만들어 보내는 능력이에요. 조별 과제 발표를 하다가 모르는 통계가 나오면 옆자리 친구의 노트북으로 검색을 부탁하는 그림과 비슷합니다. 어떤 친구(도구)에게 어떤 질문을 어떻게 던질지를 미리 약속해 두는 점이 핵심이에요. 이 개념을 알면 "왜 같은 ChatGPT인데 실시간 날씨를 알고, 메일까지 보내는지" 한 번에 이해됩니다.

한 줄 비유

실무자가 모르는 정보를 외부 전문가에게 표준 양식으로 요청하는 협업 창구입니다.

활용 예시

Case 1

KCC — 손익 분석 멀티 에이전트(사내 DB 도구)

KCC는 AWS Bedrock의 Tool Use를 사내 GenAI 플랫폼에 적용해 손익 데이터를 다루는 Profit Agent를 구축했습니다.^[7] 사용자가 "2025년 1분기 자동차 도료 손익을 보여줘"라고 묻으면 Intent 추출 Lambda가 의도를 잡고, 모델이 text2sql_function·chart_function·answer_function 같은 등록된 도구 중 어떤 것을 부를지 선택해 MS-SQL 쿼리·차트·서술형 응답을 한 번에 만들어냅니다.^[7] 부서별로 분산된 의사결정을 자동화·일원화하는 것이 목표였습니다.

Case 2

KCC — 한국은행 경제지표 API 도구

같은 플랫폼에는 한국은행 '경제 100대 지표 API'가 외부 도구로 등록되어 있습니다.^[7] 사용자가 원자재 가격이나 제조업 생산지수를 물으면 모델이 API 호출 도구를 선택해 실시간 데이터를 끌어오고, 내부 손익 데이터와 외부 거시 지표를 한 번의 질의 안에서 결합해 답변합니다.^[7] "분석-계획-실행"을 잇는 Agentic AI 워크플로의 표준 사례로 함께 소개되었습니다.

Case 3

Anthropic 공식 — Web Search 서버 도구

Anthropic은 Claude에 web_search·web_fetch·code_execution·tool_search 같은 서버 도구를 기본 제공합니다.^[1] 개발자는 tools=[{"type": "web_search", "name": "web_search"}] 같은 한 줄만 추가하면 모델이 최신 정보를 검색해 답변에 반영합니다.^[1] 또한 2025년 공개된 Tool Search Tool 베타는 수천 개의 도구를 컨텍스트 윈도우(LLM이 한 번에 처리할 수 있는 텍스트 길이)에 다 싣지 않고 필요할 때만 끌어오도록 해, 도구가 많아질수록 선택 정확도가 떨어지는 문제를 완화합니다.^[1]

Case 4

Toolformer 연구 — 자기 학습형 도구 호출(arXiv 2302.04761)

Schick 외(2023)는 6.7B 파라미터의 Toolformer가 계산기·Q&A·검색엔진 2종·번역·캘린더 6개 도구의 호출 시점을 자기 지도학습으로 익히도록 했습니다.^[5] 결과적으로 산술·사실 조회 과제에서 GPT-3급의 훨씬 큰 모델과 경쟁 가능한 제로샷 성능을 보였고, 언어 모델링 기본 성능은 유지했습니다.^[5] 도구 사용이 모델 규모 확장보다 효율적인 성능 개선 경로일 수 있음을 처음 정량적으로 보여준 결과로 인용됩니다.

참고사항

Anthropic 공식 Tool Use 문서에서 web_search 한 줄을 추가해 응답 품질이 어떻게 달라지는지 30분 안에 체감합니다.
사내에서 자주 쓰는 작업 1개(예: 재고 조회, 일정 확인)를 골라 JSON 스키마로 도구 정의를 작성합니다.
도구의 description 필드를 두 문장 이상으로 명확히 적어 모델이 호출 시점을 판단하기 쉽게 만듭니다.
tool_choice를 "auto" / "any" / 특정 도구 강제로 바꿔가며 호출 빈도가 어떻게 변하는지 비교합니다.
4건 이상 도구가 모이면 MCP 서버로 묶어 Claude Desktop·Cursor·ChatGPT 어디에서도 같은 방식으로 재사용되도록 표준화합니다.

도구가 많아질수록 모델의 선택 정확도가 떨어집니다. OpenAI 공식 가이드는 한 번에 사용 가능한 함수를 20개 이하로 유지할 것을 권고하며, 초기 정확도를 높이려면 적은 수의 도구로 시작하는 것이 안전하다고 밝힙니다.^[2] Anthropic도 도구 수가 늘어날수록 컨텍스트 윈도우가 빠르게 소모되고 잘못된 도구 선택이 늘어난다는 점을 지적하며, 2025년 Tool Search Tool 베타를 통해 필요한 도구만 검색해 가져오는 패턴을 권고했습니다.^[1] KCC 사례에서도 초기 Text2SQL은 존재하지 않는 컬럼명을 만들어내는 환각이 반복되어, 도메인 용어사전과 Chain of Thought 프롬프트로 보완했다고 보고했습니다.^[7]

진화 방향은 표준화입니다. OpenAI Function Calling이 회사 단일 규격으로 출발했다면, Anthropic이 2024년 11월 발표한 MCP는 도구·데이터 소스·모델을 잇는 공개 규약으로, 2025년 3월 OpenAI가 Agents SDK·Responses API·ChatGPT 데스크톱에 채택하면서 사실상 업계 표준이 되었습니다.^[6][3] 같은 흐름으로 Anthropic은 2025년 advanced tool use 발표에서 Programmatic Tool Calling(모델이 코드 실행 환경 안에서 도구를 직접 호출하는 패턴)과 Tool Use Examples(도구 사용 예시를 표준 형식으로 함께 전달하는 방식)를 공개해, 도구 호출이 단발성 함수 호출에서 다단계 에이전트 워크플로로 옮겨가고 있음을 보였습니다.^[8] 삼성 기술 블로그도 2025년 글에서 Function Calling을 벤더 특화 기능으로, MCP를 누구나 참여 가능한 개방 표준으로 구분하면서 두 흐름이 서로를 보완한다고 정리했습니다.^[3]

흐름

2023-06

Function Calling 발표

OpenAI가 GPT-4 모델에 Function Calling 기능을 공식 도입하며 LLM이 외부 함수를 호출하는 패러다임 시작

2024-04

Tool Use (Anthropic)

Anthropic이 Claude 3 모델에서 Tool Use를 정식 출시. OpenAI의 Function Calling과 동일한 구조를 다른 명칭으로 채택

2024-11

MCP 표준 공개

Anthropic이 Model Context Protocol(MCP)을 오픈소스로 공개하여 Tool Use를 표준화된 프로토콜로 확장

2025

Agentic 시대 본격화

Tool Use가 AI Agent의 핵심 구성요소로 자리잡으며 멀티스텝 자율 작업 수행이 일반화

이 용어와의 관계

표준화된 확장
MCPTool Use를 표준 프로토콜로 확장한 개념. 도구를 모델 간 호환 가능한 형태로 정의
발전 방향
Agentic EngineeringTool Use는 Agent가 자율적으로 행동하기 위한 기반 기술이며 Agentic Engineering의 핵심 요소
실전 구현 사례
Claude SkillsClaude가 Tool Use 기반으로 특정 작업을 수행하는 재사용 가능한 능력 패키지

Tool Use vs Function Calling

Tool Use (Anthropic)Function Calling (OpenAI)

명명 주체Anthropic이 Claude API에서 채택한 명칭OpenAI가 GPT-4에서 먼저 사용한 명칭

기본 구조tools 배열 정의 → 모델이 tool_use 블록 반환 → 결과를 tool_result로 회신functions/tools 배열 정의 → 모델이 tool_calls 반환 → 결과를 function role 메시지로 회신

스키마 형식JSON Schema 기반 input_schemaJSON Schema 기반 parameters

병렬 호출한 응답에서 여러 도구를 동시에 호출 가능parallel tool calls 지원 (2023년 11월 이후)

확장 표준MCP(Model Context Protocol)로 표준화 진행OpenAI 자체 생태계 중심으로 발전

본질명칭만 다르고 작동 원리는 동일 — LLM이 외부 함수를 호출하는 동일 패러다임명칭만 다르고 작동 원리는 동일 — LLM이 외부 함수를 호출하는 동일 패러다임