System Prompt
시스템 프롬프트
AI 활용 분야에서 쓰이는 용어로, LLM에 대화 시작 전에 사람·인격·규칙을 미리 주입해 이후 모든 응답에서 그 지침을 따르도록 만드는 최상위 지시문입니다.
조별 과제 시작 전에 "우리 모두 존댓말 쓰고, 결정은 다수결로 가자"고 그라운드 룰을 못 박아 두는 것과 같아요. 시스템 프롬프트는 LLM과 대화를 시작하기 전에 "너는 이런 직원이고, 이런 말투로, 이런 건 답하면 안 돼"라고 한 번 박아 두는 사전 지시문입니다. 매번 같은 말을 반복하지 않아도 모델이 그 규칙을 끝까지 기억하고 응답해 줘요. 챗봇·자동화·사내 어시스턴트처럼 같은 톤을 길게 유지해야 하는 작업에서는 가장 먼저 손대는 기본 설정입니다.
신입에게 출근 첫날 건네는 업무 매뉴얼과 같습니다.
Anthropic Claude — 공식 시스템 프롬프트 공개
Anthropic은 2024년 7월부터 claude.ai와 모바일 앱에 적용되는 시스템 프롬프트 전문을 공식 릴리스 노트에 공개하고 있습니다.[2] Claude 4 시스템 프롬프트에는 현재 날짜, 모델 정체성, 응답 톤, 자해 관련 안전 가이드, 미국 대선 결과 같은 사실 고정값까지 들어 있습니다.[6] 본문만 약 6,471토큰에 달하는 web_search 사용 지침이 별도로 붙어 있고, 시스템 프롬프트만 바꿔도 응답 톤·검색 횟수·아티팩트 작성 방식이 통째로 달라집니다.[6] API에서 동일 모델을 시스템 프롬프트 없이 호출하면 자기소개 답변부터 짧고 일반화된 형태로 바뀝니다.[6]
한국 스타트업 — 한국어 챗봇 시스템 프롬프트 설계
국내 핀테크 토스 기술 블로그는 휴리봇 사례에서 "AI가 사람처럼 말하게 만드는 5가지 프롬프트"를 공유하며, 시스템 프롬프트로 역할·말투·금지어를 못 박는 방식을 정리했습니다.[7] 네이버 스마트스튜디오 블로그도 시스템 프롬프트에서 역할 정의와 응답 형식을 먼저 고정한 뒤 User Prompt를 받게 설계하라고 안내합니다.[8] 카카오클라우드는 고려대 KUCC가 만든 학교 챗봇 'ASKu'에서 시스템 프롬프트로 "OO 교육센터의 KDT 운영·행정 지원 챗봇" 역할을 고정한 사례를 소개했습니다.[9] 학생 응대 톤과 답변 가능 도메인이 운영 기간 내내 일관되게 유지된 점이 핵심 효과로 기록됐습니다.[9]
OpenAI Model Spec — 엔터프라이즈 권한 계층
OpenAI는 2025년 Model Spec에서 system / developer / user / guideline 4단계 권한 계층을 정의하고, 상위 지시가 하위 지시를 항상 덮어쓰도록 규정했습니다.[1] 같은 문서는 o1 계열에서 system 메시지가 자동으로 developer 메시지로 변환되며, GPT-4o에서는 그 반대 변환이 일어난다고 기술합니다.[1] 기업 고객은 developer 메시지에 비즈니스 룰·도메인 지식·금칙어를 적어 두고, 최종 사용자는 user 메시지만 보내는 구조로 책임 경계를 가릅니다.[1] arXiv 2502.12197 연구는 가드레일 수가 늘수록 최신 LLM의 시스템 프롬프트 준수율이 빠르게 0에 수렴한다는 결과를 보고했습니다.[10]
학계 연구 — Instruction Hierarchy 학습으로 견고성 +34%
OpenAI 연구진은 arXiv 2404.13208 "The Instruction Hierarchy" 논문에서 시스템 메시지를 최상위로 두는 권한 계층을 학습 데이터로 주입했습니다.[11] 프롬프트 인젝션·시스템 프롬프트 추출 등 공격을 레드팀이 생성하고, 일반 지시 따르기 예시와 섞어 파인튜닝했습니다.[11] 그 결과 학습되지 않은 신규 공격 유형에서도 일반화된 견고성이 최대 34%까지 상승했습니다.[11] 한 줄로 정리하면, 시스템 프롬프트는 단순 텍스트가 아니라 모델 학습 단계부터 "지킬 권한"을 부여하는 설계 대상이 되고 있다는 흐름입니다.[11]
- ChatGPT나 Claude 워크스페이스의 "Custom Instructions / Project Instructions"에 직무·말투·금지어를 한 문단으로 적어 봅니다.
- 같은 User Prompt를 시스템 프롬프트 유무 두 가지로 돌려 응답 차이를 캡처해 둡니다.
- 사내 챗봇이라면 시스템 프롬프트에 "회사명, 응대 톤, 답변 불가 항목, 에스컬레이션 안내 URL"을 먼저 박아 둡니다.
- Anthropic 릴리스 노트의 Claude 시스템 프롬프트 한 편을 읽으며 안전 문구·톤 지침의 구조를 그대로 차용해 봅니다.
- 동일 시스템 프롬프트로 10개 질문을 돌려 응답 형식 일관성을 체크리스트로 평가합니다.
시스템 프롬프트는 만능 통제 장치가 아닙니다. arXiv 2502.12197 "A Closer Look at System Prompt Robustness"는 시스템 메시지에 가드레일 수가 늘어날수록 최신 LLM의 준수율이 빠르게 0에 가까워진다는 결과를 보고했습니다.[10] 가드레일 1~2개 수준에서는 거의 100%에 가깝게 지시를 따르던 모델이 10개를 넘어가면 준수율이 한 자릿수까지 떨어진다는 측정도 함께 실렸습니다.[10] Pliny the Elder 같은 연구자들이 Claude 4를 포함한 주요 모델의 시스템 프롬프트 전문을 잇따라 유출해 GitHub에 공개한 사례도 있어, 시스템 프롬프트를 영업비밀처럼 다루는 전략은 한계가 분명합니다.[6] 사용자 친화 인터페이스인 Claude Projects나 Custom GPTs에서도 결국 시스템 프롬프트 본문이 모델 출력으로 흘러나오는 추출 공격이 보고됩니다.[10] 결국 "무엇을 시스템 프롬프트에 적는가"보다 "적힌 지시가 무엇까지 막을 수 있는가"를 미리 가늠하고 운영해야 한다는 뜻입니다.[1]
진화 방향은 두 갈래로 정리됩니다.
- OpenAI Model Spec과 "Instruction Hierarchy" 논문처럼 시스템·개발자·사용자 메시지에 권한 등급을 부여하고 학습 단계에서 그 위계를 모델에 새겨 넣는 흐름입니다.[1][11] Anthropic이 Constitutional AI에서 모델 자체에 헌법 조항을 학습시킨 것과 같은 방향이며,[4] 시스템 프롬프트의 "강제력"을 텍스트가 아닌 가중치로 옮기려는 시도로 볼 수 있습니다.
- arXiv 2506.15751 Sysformer처럼 사용자 입력에 맞춰 시스템 프롬프트 자체를 실시간으로 다듬는 적응형 방식이 제시되고 있으며, 거부율 기준으로 최대 80% 개선이 보고됐습니다.[12] 현재 시점에서는 Claude Projects·Custom GPTs 같은 인터페이스가 시스템 프롬프트의 진입 장벽을 낮추는 동안, 보안·법무 분야에서는 권한 계층 학습과 적응형 시스템 프롬프트가 표준으로 자리 잡아 가는 흐름이라고 볼 수 있습니다.[1][11][12]
- 유사 개념User Prompt같은 대화에서 사용자가 실제로 입력하는 짝꿍 입력입니다
- 기반 기술Prompt Engineering역할·규칙 설계가 프롬프트 엔지니어링의 출발점입니다
- 대표 도구Custom InstructionsChatGPT에서 시스템 프롬프트를 사용자가 직접 설정합니다
- 다음 단계Persona Prompting역할 지정에서 한발 더 나아간 캐릭터 부여 기법입니다
- Model Spec (2025/12/18) — 공식 문서 · OpenAI · 2025-12
- System Prompts — 공식 문서 · Anthropic · 2024-07~2026
- Highlights from the Claude 4 system prompt — 분석 기사 · Simon Willison · 2025-05-25
- 휴리봇 이야기 #2: AI가 사람처럼 말하게 만드는 5가지 프롬프트 — 기업 기술 블로그 · 토스 · 2024
- Prompt Engineering으로 수월하게 대화하기 — 기업 기술 블로그 · 네이버 SmartStudio · 2024
- 대학생 개발자가 만든 AI 챗봇, 카카오클라우드로 날개 달다 — 사례 기사 · 카카오클라우드 · 2024
- A Closer Look at System Prompt Robustness — arXiv 논문 · 2025-02
- The Instruction Hierarchy: Training LLMs to Prioritize Privileged Instructions — arXiv 논문 · OpenAI · 2024-04
- Sysformer: Safeguarding Frozen LLMs with Adaptive System Prompts — arXiv 논문 · 2025-06
- Prompting best practices — 공식 문서 · Anthropic · 2025
이 페이지가 도움이 되었나요?
제안·수정 요청은 meet@percent.ac 로 보내주시면 다음 갱신에 반영합니다.