프롬프트·AI 활용

Persona Prompting

페르소나 프롬프팅

AI 활용 분야에서 쓰이는 용어로, LLM에 특정 인물·직업·성격 설정을 주입해 그 역할에 맞춘 어조와 시선으로 답하도록 유도하는 프롬프트 기법입니다.

쉬운 풀이

페르소나 프롬프팅은 AI에게 "당신은 베테랑 세무사예요" "당신은 10년차 카피라이터입니다" 처럼 역할을 먼저 지정해 두고 질문을 던지는 방식이에요. 조별 과제에서 발표 맡은 친구에게 "이번엔 교수님 톤으로 설명해 줘" 하고 시점을 정해 주는 것과 비슷합니다. 같은 질문도 "초등학생에게 설명하듯", "투자 심사역 관점으로", "고객지원팀 7년차 매니저처럼"처럼 시선을 바꾸면 답변의 난이도·어휘·결론 잡는 방식이 달라져요. 톤과 시선을 손에 쥐는 가장 짧은 한 줄, 그래서 시스템 프롬프트의 첫 줄로 가장 자주 쓰이는 패턴이라고 보면 됩니다.

한 줄 비유

회의 시작에 "오늘은 감사 자리에서 봐 주세요"라고 자리를 정해 두는 격입니다.

활용 예시

Case 1

Anthropic — Claude 시스템 프롬프트 표준 패턴

Anthropic 공식 문서는 "Giving Claude a role with a system prompt"를 권장 기법으로 명시하고, system 파라미터에 "당신은 Fortune 500 기업의 베테랑 데이터 사이언티스트입니다" 같은 한 줄을 둔 다음 user 메시지에는 분석 과제만 담으라고 안내합니다 ^[1]. 같은 문서는 "고객 인사이트 분석을 전문으로 하는 Fortune 500 데이터 사이언티스트"처럼 페르소나를 한 번 더 좁히면 답변의 관점이 또 한 단계 달라진다고 정리합니다 ^[1]. 보안 검토·법무·재무처럼 도메인 시각이 결과를 가르는 영역에서 자주 쓰이는 패턴입니다 ^[1].

Case 2

OpenAI — Instruction Hierarchy로 페르소나 위계 학습

OpenAI는 2024년 4월 발표한 "The Instruction Hierarchy: Training LLMs to Prioritize Privileged Instructions" 논문에서, system 메시지가 user 메시지보다, user 메시지가 도구·문서 출력보다 우선한다는 위계를 모델 학습 단계에 직접 새겨 넣었습니다 ^[4]. 동일 위계는 OpenAI Model Spec에도 명문화되어 있어, system·developer 위치에 적힌 페르소나는 사용자 메시지가 뒤집기 어렵게 설계되어 있습니다 ^[4]. 같은 논문은 학습되지 않은 신규 jailbreak 공격에 대한 견고성이 최대 +34%p 상승했다고 보고합니다 ^[4].

Case 3

ChatGPT Custom Instructions·GPTs — 페르소나의 영구 저장 형태

OpenAI는 2023년 7월 Custom Instructions를 출시해, 매번 "당신은 마케팅 기획자입니다"라고 다시 말하지 않아도 계정 설정에 한 번 적어 두면 모든 신규 대화에 자동 적용되도록 만들었습니다 ^[5]. 이어 2023년 11월 DevDay에서 GPTs를 공개하면서 페르소나·지식·도구 호출을 하나의 GPT로 묶어 공개·배포할 수 있게 했고, 2024년 1월 GPT Store가 열린 뒤 2025년 기준 누적 GPT 수는 300만 건을 넘었다고 OpenAI가 밝혔습니다 ^[6]. 즉 "Act as ..." 한 줄로 시작된 페르소나 기법은 system 메시지 → 사용자 설정 → 공개 가능한 GPT로 점점 영구화된 모양새입니다 ^[5][6].

Case 4

학계 — 페르소나가 항상 정답률을 올리지는 않는다

카네기멜런대 Zheng et al.이 2024년 EMNLP Findings에 발표한 연구는 162개 역할(관계 6종 × 전문성 8종)과 2,410개 사실 질문을 4개 LLM 계열에 교차 적용한 결과, 시스템 프롬프트에 페르소나를 끼워 넣어도 객관 사실 정답률은 페르소나가 없는 기준선 대비 의미 있게 오르지 않았다고 보고했습니다 ^[2]. 같은 논문은 질문별 최적 페르소나를 자동 식별하는 작업도 무작위 선택과 큰 차이가 없었다고 정리합니다 ^[2]. USC PRISM 논문은 전문가 페르소나가 정렬 과제에서는 도움이 되지만 수학·코딩 과제에서는 정확도를 최대 30%p 가까이 떨어뜨릴 수 있다고 분석해, 페르소나는 톤·시선 조정에 쓰고 사실성은 RAG·구조화 출력으로 분리하라는 분업이 표준 권고로 자리잡았습니다 ^[3][1].

참고사항

자주 묻는 질문 1개를 골라 페르소나 없는 응답과 "당신은 ○○ 전문가입니다" 한 줄을 붙인 응답을 나란히 비교해 봅니다 ^[1]
사내 챗봇 시스템 프롬프트 첫 줄에 직무·연차·말투·금지어를 한 문단으로 명시해 둡니다 ^[1]
페르소나에 "근무 연차, 사용하는 전문 용어, 응대 톤" 3가지를 함께 적어 추상적 역할 지정의 한계를 줄입니다 ^[1]
자주 쓰는 페르소나는 ChatGPT Custom Instructions 또는 Claude Personal preferences에 1회 저장해 매번 다시 적지 않도록 합니다 ^[5]
사실 정확성이 중요한 질문은 페르소나에만 의존하지 말고 RAG·출처 인용 지시·구조화 출력과 함께 묶어 운용합니다 ^[3]

페르소나 프롬프팅은 사실 정확성을 보장하지 않습니다. arXiv 2311.10054 Zheng et al. 연구는 162개 역할을 2,410개 사실 질문에 적용한 결과 객관 정답률이 페르소나 없는 기준선 대비 유의미하게 오르지 않았다고 보고했고, 질문별 최적 페르소나를 자동 식별하는 작업도 무작위 선택과 큰 차이를 보이지 않는다고 정리했습니다 ^[2]. USC PRISM 논문은 전문가 페르소나가 정렬 과제에서는 도움이 되지만 수학·코딩처럼 사전학습 지식에 의존하는 과제에서는 정확도를 떨어뜨릴 수 있고, 무관한 페르소나 디테일이 추가되면 성능이 최대 30%p가량 하락한다고 분석했습니다 ^[3]. 보안 측면에서도 페르소나는 양날입니다. "DAN(Do Anything Now)" 계열의 페르소나 부여 프롬프트가 LLM의 안전 가드레일을 우회하는 대표적인 탈옥(jailbreak) 경로로 쓰여 왔다는 점이 학계와 산업에서 모두 보고됐습니다 ^[4].

진화 방향은 세 갈래로 정리됩니다.

페르소나를 무지성으로 붙이지 않고 과제 유형에 따라 선택적으로 적용하는 흐름입니다. USC PRISM은 사용자 의도에 맞춰 페르소나를 동적으로 라우팅하는 방식을 제안했고 ^[3], Anthropic·OpenAI 공식 가이드도 페르소나는 톤·캐릭터 유지에 우선 쓰고 사실성 보강은 RAG·구조화 출력으로 분리하라는 단계적 접근을 명시합니다 ^[1][4].
"Act as ..." 한 줄이 system 메시지로 표준화된 뒤 다시 Custom Instructions·GPTs·Personal preferences 같은 계정·프로젝트 단위 영구 설정으로 이동하고 있습니다 ^[5][6].
페르소나 기반 탈옥을 막기 위한 instruction hierarchy 학습이 표준이 되어, OpenAI 논문 기준 신규 공격 견고성이 최대 +34%p 향상됐고 ^[4], 페르소나는 사라지지 않고 "어디까지 따르고 어디부터 거부할지"를 모델이 스스로 판단하는 형태로 다듬어지고 있습니다 ^[4].

이 용어와의 관계

유사 개념
Prompt Version같은 프롬프트·AI 활용 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
Prompt Library같은 프롬프트·AI 활용 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
Memory같은 프롬프트·AI 활용 갈래에서 자주 함께 등장하는 개념입니다.