보안·윤리

Bias

바이어스

AI 활용 분야에서 쓰이는 용어로, 학습 데이터·모델 설계·운영 환경에 들어 있는 사회적 불균형이 인공지능 출력에 그대로 반영돼 특정 집단에 불리하게 작동하는 현상을 통칭하는 표현입니다.

쉬운 풀이

편향은 AI가 사람·사회의 한쪽 기울기를 그대로 답안에 옮겨 적는 현상이에요. 예전 합격자 명단만 보고 채용 평가표를 만들면, 과거에 합격이 어려웠던 학과·성별이 계속 감점되는 것과 비슷합니다. 학습 데이터가 한쪽으로 쏠려 있거나, 평가 기준이 전체 평균만 보거나, 운영 환경이 특정 집단을 자주 마주치면 모두 편향으로 이어져요. 채용·신용평가·얼굴 인식처럼 사람 인생에 영향을 주는 곳에서 자주 문제가 되기 때문에, "전체 정확도"가 아니라 "집단별 정확도"를 따로 보는 습관이 필요합니다.

한 줄 비유

과거 합격자 명단으로만 만든 평가표는 과거의 차별을 그대로 결재 라인에 올립니다.

활용 예시

Case 1

MIT Media Lab — 상용 얼굴 분석 정확도 격차 감사 (2018)

Buolamwini·Gebru는 IBM·Microsoft·Face++의 상용 얼굴 분석 시스템을 1,270장 이미지로 감사했습니다.^[1][8] 밝은 피부 남성에서는 오류율이 0.8%였지만, 어두운 피부 여성에서는 20.8%, 34.5%, 34.7%까지 치솟았습니다.^[1] 보안·출입통제·신원확인 시스템을 도입하기 전 하위 집단별 정확도 분해 보고가 표준 절차가 돼야 함을 보여 준 사례로 인용됩니다.

Case 2

스캐터랩 '이루다' — 학습 데이터 편향 사건 (한국, 2021)

스캐터랩이 2020년 12월 출시한 챗봇 '이루다'는 연인 대화 약 100억 건을 학습했습니다.^[3] 출시 2주 만에 흑인·성소수자·여성에 대한 차별·혐오 발언이 보고됐고, 비식별화되지 않은 실명·주소·계좌번호 노출 의혹이 겹쳐 20일 만에 서비스가 중단됐습니다.^[3] 챗봇·고객 응대 모델을 출시하기 전 데이터 클렌징과 민감 발화 시나리오 테스트가 의무 단계가 돼야 함을 보여 준 국내 첫 대형 사례로 인용됩니다.

Case 3

Amazon — 채용 AI 폐기 (2018)

Amazon은 2014년부터 이력서를 5점 척도로 채점하는 사내 채용 AI를 개발했지만 2018년 폐기했습니다.^[4] 학습 데이터가 지난 10년간 합격자 이력서였고 지원자 다수가 남성이었던 탓에 모델이 "women's"가 포함된 이력서와 일부 여대 졸업생을 감점했습니다.^[4] 'executed', 'captured' 같은 남성 엔지니어 이력서에 흔한 동사를 선호하기도 했습니다.^[4] 인사·평가 자동화에 과거 데이터를 그대로 쓸 때 점검해야 할 표준 사례로 NIST와 학계가 함께 인용합니다.

Case 4

Apple Card — 신용한도 성별 격차 의혹 (2019)

2019년 11월 개발자 David Heinemeier Hansson이 자신과 부인의 Apple Card 한도가 20배 차이라고 공개했고, Apple 공동창업자 Steve Wozniak도 부부 간 10배 격차를 보고했습니다.^[5] 발행사 Goldman Sachs는 "성별을 입력값으로 쓰지 않는다"고 해명했지만, 뉴욕 금융감독국이 조사에 착수했습니다.^[5] 보호 속성을 직접 쓰지 않아도 우편번호·소비 패턴 같은 상관 변수로 차별이 재현될 수 있다는 점이 핵심 쟁점이었고, 금융·보험 모델 감사 기준의 출발점이 됐습니다.

참고사항

학습 데이터의 성별·연령·지역 분포를 표로 정리해 과대·과소 대표 집단을 식별합니다.
전체 정확도 대신 하위 집단별 정확도·오류율을 분리해 측정하고 격차 임계치를 정합니다.
보호 속성(성별·인종 등)을 직접 쓰지 않아도, 그것과 상관관계가 높은 대리 변수(우편번호·소비 패턴 등)를 함께 점검합니다.
출시 전 민감 발화·차별 시나리오 100건 이상을 정해 레드팀 테스트를 돌리고, 통과 기준을 사양서에 명시합니다.
NIST AI RMF 1.0(GOVERN·MAP·MEASURE·MANAGE)과 SP 1270 편향 분류표로 자체 감사 체크리스트를 만들고, 분기 단위로 운영 단계 편향을 재측정합니다.

편향은 완전히 제거하기 어렵습니다. 김재인 경희대 비교문화연구소 교수는 이루다 사건에 대해 "100억 건 데이터 전부를 통제하는 것은 불가능하다"고 지적했습니다.^[3] NIST도 AI RMF에서 편향을 "관리(managed)" 대상으로 표현하며, 완전 제거가 아닌 지속적 측정·완화의 문제로 규정합니다.^[2] 보호 속성을 모델 입력에서 빼도 우편번호·구매 패턴 같은 대리 변수로 차별이 재현되는 점, 그리고 NIST SP 1270이 추가한 인적·시스템적 편향처럼 데이터 바깥의 운영·해석 단계에서 새로 끼어드는 편향이 한계로 남습니다.^[7] Apple Card 사례처럼 발행사가 "성별을 입력값으로 쓰지 않는다"고 해명해도 결과의 격차가 사회적 차별로 인식되는 흐름도 같은 맥락입니다.^[5] 결국 "입력에서 뺐다"가 "편향이 없다"는 증거가 되지 못한다는 점이 거버넌스 설계의 출발점이 됐습니다.

진화 방향은 세 갈래입니다.

Buolamwini·Gebru가 제시한 하위 집단별 정확도 분해 평가가 산업 표준이 되면서 IBM은 감사 이후 신규 모델 데이터셋을 균형 재구성했고, MIT News는 이를 "상용 시스템의 편향 보고 관행을 바꾼 연구"로 평가했습니다.^[1][8]
NIST AI RMF(2023)와 EU AI Act가 고위험 시스템에 편향 영향 평가를 의무화하는 거버넌스 흐름을 만들고 있고, EU AI Act는 부속서 III에서 채용·신용평가를 고위험 영역으로 명시했습니다.^[2] 한국은 2026년 1월 시행 'AI 기본법'에서 채용·대출심사 등을 '고영향 AI'로 묶어 책임성을 부여하는 흐름을 따르고 있습니다.
Sheng 등의 EMNLP 2019 논문 'The Woman Worked as a Babysitter'는 LLM(Large Language Model, 거대 언어 모델)의 직업·성별 연상 편향을 정량화하는 Regard 지표를 제시해 생성형 AI 편향 측정의 기반을 마련했고, 이후 BBQ·BOLD 같은 벤치마크가 같은 흐름을 이어받아 생성형 AI 편향 평가의 표준 도구로 자리잡고 있습니다.^[6]

이 용어와의 관계

유사 개념
AI Governance같은 보안·윤리 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
EU AI Act같은 보안·윤리 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
Red Teaming같은 보안·윤리 갈래에서 자주 함께 등장하는 개념입니다.