프롬프트·AI 활용

One-shot

원샷

AI 활용 분야에서 쓰이는 용어로, LLM에 정답 예시를 단 하나만 보여주고 같은 형식·말투를 그대로 따라 새 답을 만들어 내도록 시키는 프롬프트 기법입니다.

쉬운 풀이

교수님이 시험 직전에 "예시 답안 딱 하나 보여줄게" 하고 모범 풀이 한 장을 펴 보이면, 처음 보는 문제도 어떤 형식·길이·말투로 써야 할지 한 번에 잡히잖아요. One-shot도 똑같이 LLM에 "이런 입력엔 이런 출력" 짝을 정확히 한 건만 끼워 보여주면 모델이 그 한 건의 패턴을 따라 같은 형식으로 답을 만듭니다. 인턴이 첫 보고서를 쓸 때 선배 보고서 한 부를 옆에 놓고 따라 쓰는 것과 같은 원리예요. 가장 가벼운 예시 한 건만 붙이면 되니 토큰을 아끼면서도 형식이 흔들리는 케이스를 잡을 수 있는 첫 단추로 자주 씁니다.

한 줄 비유

RFP에 표준 양식 한 장을 끼워 외주사에 "이대로 써 주세요"라고 부탁하는 방식입니다.

활용 예시

Case 1

OpenAI GPT-3 — TriviaQA에서 예시 한 건만 추가

OpenAI는 GPT-3 논문에서 같은 175B 모델·같은 파라미터를 그대로 두고 zero-shot·one-shot·few-shot 셋의 점수를 모두 측정했습니다.^[1] 폐쇄형 QA 벤치마크 TriviaQA에서 zero-shot 정답률 64.3%였던 모델이 정답 사례 한 건만 프롬프트에 끼우자 68.0%로 올랐습니다.^[1] 같은 모델에 학습도 추가 비용도 없이 예시 한 건만 붙여 점수가 단계적으로 움직인다는 사실이 처음 체계적으로 보고된 사례로, 이후 모든 프롬프트 가이드의 출발점이 됐습니다.

Case 2

사내 견적서 JSON 추출 — 한 건의 예시로 키 구조 고정

영업팀이 받은 견적 메일을 JSON으로 추출하는 사내 도구에서, 원하는 키 이름·중첩 구조·null 처리까지 모두 담은 JSON 한 건을 예시로 붙입니다. Anthropic 공식 가이드는 "출력 형식을 통제하는 가장 안정적인 수단은 예시"라고 명시하며, 한 건만 보여줘도 키 순서·자료형이 일관되게 따라온다고 안내합니다.^[3] GPT-3 논문 기준 one-shot은 zero-shot 대비 TriviaQA에서 +3.7%p 차이를 보였고, 형식 준수가 핵심인 추출 과제에서는 이 격차가 더 크게 나타납니다.^[1]

Case 3

고객 문의 분류 — 경계 사례 한 건으로 기준점 제공

고객 문의를 "환불·배송·계정·기타"로 자동 분류할 때, "환불"이라는 단어가 들어가지만 실제로는 배송 지연 클레임인 경계 사례를 정확히 한 건 보여줍니다. DeepMind의 one-shot learning 연구가 보였듯, 모델은 단 한 장의 예시로도 "이 카테고리는 이런 모양"이라는 패턴을 잡아냅니다.^[2] 2023년 arXiv 후속 연구는 in-context learning 설정에서 클래스당 예시 한 건만 끼워도 zero-shot 대비 분류 정확도가 의미 있게 오른다고 보고했습니다.^[5] 라벨링 데이터를 따로 모으기 전 베이스라인을 빠르게 만드는 표준 패턴입니다.

Case 4

한국어 보고서 톤 — 종결 어미 한 건으로 정렬

국내 기업이 사내 메모를 "~입니다" 90% / "~예요" 10% 비율로 통일하고 싶을 때, 같은 문체로 작성된 짧은 메모 한 건을 예시로 붙입니다. GPT-4·Claude 세대는 zero-shot에서도 의미는 잘 잡지만, 한국어 종결과 격식 톤은 예시 한 건만 있어도 눈에 띄게 안정됩니다. 한국컴퓨터정보학회 논문(2024)은 GPT-4가 한국어 감성 분석 zero-shot에서 한국어 전용 fine-tuned 모델에 근접한다고 보고했지만,^[6] 사내 톤·종결 어미처럼 미세 신호가 중요한 영역은 예시 한 건의 비용 대비 효과가 가장 큰 구간입니다.

참고사항

자주 반복하는 한 가지 업무(분류·요약·추출·카피 작성)를 고릅니다
그 업무의 "가장 좋은 결과물" 한 건을 골라 입력·출력 쌍으로 정리합니다
시스템 프롬프트에 지시문 한 줄과 함께 그 한 쌍만 붙입니다
예시를 뺀 zero-shot 버전과 결과를 비교해 형식·톤·정확도 차이를 메모합니다
한 건으로 부족한 케이스가 보이면 그때 예시 1~2개를 추가해 few-shot으로 확장합니다

예시가 한 건뿐이라 그 한 건이 가진 편향·실수가 결과에 그대로 옮겨옵니다. GPT-3 논문 기준 SuperGLUE 같은 추론 벤치마크에서는 one-shot이 zero-shot보다 오히려 낮게 나오는 구간도 관찰됐고, TriviaQA에서도 one-shot 68.0% vs few-shot 71.2%로 예시 한 건만으로는 천장에 닿지 않습니다.^[1] 분류 과제에서도 라벨이 여러 개일 때 한 건의 예시는 한 카테고리에만 신호를 주기 때문에, 클래스 경계가 복잡하면 few-shot이 더 안정적입니다.^[5] 또 예시 한 건이 비전형적이거나 오류를 포함하면 모델이 그 오류까지 학습된 패턴으로 따라가는 위험이 있어, "어떤 한 건을 고르는가"가 그대로 품질 좌우 변수가 됩니다.^[3]

진화 방향은 두 갈래입니다.

모델 자체가 똑똑해지면서 one-shot이 가장 의미 있는 구간이 좁아지고 있습니다. OpenAI·Anthropic 공식 문서는 "추론 모델에서는 zero-shot으로 먼저 시도하고, 부족하면 예시 한 건부터 보강하라"는 단계적 접근을 명시합니다.^[3][4] GPT-4·Claude 세대 zero-shot이 GPT-3 시대의 one-shot 점수에 근접하면서, 굳이 예시를 끼우지 않아도 형식이 잡히는 작업이 늘어나고 있습니다. 2024년 9월 OpenAI o1 발표 이후 등장한 추론 모델 흐름에서는 모델이 응답 전에 자체적으로 단계를 짚기 때문에 사용자가 예시로 형식을 잡아 줘야 할 필요가 한 번 더 줄어듭니다.^[4]
사용자 입력과 가장 비슷한 한 건을 벡터 검색으로 그때그때 골라 끼우는 "동적 one-shot"이 RAG 기반 생산 시스템의 표준이 되고 있습니다.^[3] 정적인 예시 한 건을 매번 똑같이 붙이는 대신, 입력과 가장 닮은 사례를 그 자리에서 가져와 끼우는 방식이라 토큰 비용은 거의 그대로 두면서 케이스별 적합도를 끌어올릴 수 있습니다. 정리하면 one-shot은 "한 건이면 충분한 작업"과 "few-shot으로 넘어가기 전 시험 단계" 두 자리에서 가장 효율이 높고, 어떤 작업에 어느 만큼의 예시·추론 예산을 쓸지 그 균형을 잡는 것이 실무 설계의 핵심입니다.

이 용어와의 관계

유사 개념
Prompt Version같은 프롬프트·AI 활용 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
Prompt Library같은 프롬프트·AI 활용 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
Persona Prompting같은 프롬프트·AI 활용 갈래에서 자주 함께 등장하는 개념입니다.