Accessibility
액세서빌리티, A11y
AI 활용 분야에서 쓰이는 용어로, 시각·청각·운동·인지 장애가 있는 사용자도 동등하게 디지털 서비스를 쓸 수 있도록 인공지능을 활용해 자막·음성·대체 텍스트를 자동 생성·보완하는 분야입니다.
Accessibility는 시각·청각·운동·인지에 어려움이 있는 사용자도 비장애인과 똑같이 앱·웹·영상을 쓸 수 있게 만드는 분야예요. 조별 발표로 비유하면, 자료를 화면으로만 보여 주는 게 아니라 발표 원고·자막·대체 설명을 같이 준비해 두는 것과 같습니다. 예전에는 자막 작성·이미지 설명·점자 변환을 사람이 일일이 손으로 했지만, 요즘은 AI가 음성을 자막으로 옮기고 이미지 안의 텍스트를 읽어 주는 식으로 보조해 줘요. 디지털 서비스를 만드는 거의 모든 직무가 한 번은 마주치는 영역이라 알아 두면 도움이 됩니다.
견적서를 모든 결재자가 읽도록 표준 양식을 갖추는 일과 같습니다.
Apple — Live Captions 다국어 확장과 한국어 지원
Apple은 2022년 iOS 16에서 통화·영상의 음성을 온디바이스 머신러닝으로 자동 자막화하는 Live Captions(라이브 캡션)를 도입했고, 2023년 5월에는 사용자가 15분간 텍스트를 녹음해 자기 목소리를 합성하는 Personal Voice(퍼스널 보이스)도 공개했습니다.[4] 2025년 5월 발표에서는 Live Captions에 한국어를 포함한 영어(인도·호주·영국·싱가포르)·중국어·스페인어·프랑스어·일본어·독일어가 추가됐고, Apple Watch에서 페어링된 iPhone이 들은 소리를 손목 화면에서 자막으로 보는 Live Listen 연동도 함께 공개됐습니다.[5] 사내 회의가 다국어로 진행되는 조직에서 외주 자막 비용을 줄이는 용도로 검토할 수 있습니다.
소보로(SOVORO) — 한국 청각장애 대학생 대상 실시간 자막 서비스
소보로는 마이크로 들어오는 음성을 평균 정확도 97% 수준으로 실시간 자막화하는 한국 스타트업의 AI 서비스로, 청각장애 학생이 강의·회의에서 비장애 학생과 동등하게 정보를 받을 수 있도록 설계됐습니다.[6] 창업 초기 대구대학교 장애학생지원센터에서 시범 운영해 강의 통역 비용을 줄이는 사례로 자리잡았고, 이후 학교 수업·기업 회의·공공기관 민원 응대·병원 상담까지 영역을 넓혔습니다.[6] 2022년에는 Google for Startups Accelerator(구글 포 스타트업 액셀러레이터) 아시아 6기에 선정돼 글로벌 액셀러레이션을 받았습니다.[7] 공공기관·대학이 자막 통역사를 상시 배치하기 어려운 정기 회의에 보조 수단으로 검토할 수 있습니다.
Microsoft — Seeing AI 다국어·다플랫폼 확장
Microsoft Garage가 2017년 iOS로 출시한 Seeing AI(시잉 에이아이)는 카메라로 비춘 텍스트·인물·지폐·바코드를 음성으로 설명해 주는 무료 앱입니다.[8] 2023년 12월에는 Android 정식 버전이 출시되면서 한국어를 포함해 18개 언어로 사용 범위가 확대됐고, 한국어 음성 안내도 정식 지원됐습니다.[8] 시각장애 사용자가 앱을 카메라에 비추기만 하면 명함·약 봉지·계약서 같은 인쇄물을 음성으로 들을 수 있어, 미국시각장애인재단(AFB)의 헬렌 켈러 공로상도 수상했습니다.[8] 콜센터·키오스크 사업자가 시각장애 고객 응대 매뉴얼의 보조 도구로 도입을 검토할 수 있습니다.
한국 NIA·WebWatch — 공공 분야 웹 접근성 인증과 한국 수어 데이터셋
한국에서는 과학기술정보통신부가 지정한 인증 기관(한국디지털접근성진흥원, WebWatch, 한국시각장애인연합회)이 KWCAG 2.2 기준으로 웹·앱·키오스크 접근성을 심사하고 품질 인증 마크를 부여합니다.[2] WebWatch의 공개 인증 현황에 따르면 누적 인증 사이트는 1만 7천 건을 넘었고, 2025년 3월부터 수수료 체계가 개정되며 공공 발주 기준으로 자리 잡았습니다.[9] 같은 NIA는 AI 허브를 통해 한국 수어 영상 53만 6,000개를 공개해, 수어 자동 인식·자막화 모델 학습용 표준 데이터셋으로 활용할 수 있게 했습니다.[10] 공공기관 사업 발주의 RFP에 표준 인증·데이터셋으로 인용됩니다.
- 자사 웹사이트를 KWCAG 2.2 검사 항목 33개 중 색 대비·키보드 접근·대체 텍스트 3개부터 1페이지만 자가 점검합니다.
- 이미지에 대체 텍스트가 비어 있는 항목을 추출해 LLM(거대 언어 모델)으로 초안을 생성한 뒤 사람이 검수합니다.
- 회의 녹화본에 Apple Live Captions나 소보로 같은 실시간 자막 도구를 적용해 사내 공유본을 만듭니다.
- RFP의 참고 자료 항목에 NIA 한국 수어 데이터셋·KWCAG 2.2 검사 항목을 인용해 공공 사업 제안 시 표준 근거로 씁니다.
- Microsoft Seeing AI나 Google Lookout을 직접 깔아 사내 보고서 이미지에 한 번 비춰 보고, 음성 설명 품질을 사용자 입장에서 기록합니다.
AI 기반 접근성 보조 도구는 정확도와 신뢰 측면에서 아직 한계가 있습니다. CHI(Conference on Human Factors in Computing Systems, 인간-컴퓨터 상호작용 학회) 2024에 게재된 arXiv 연구는 시각장애 사용자가 AI 장면 설명 앱을 평가했을 때 만족도가 5점 만점에 2.76점, 신뢰도가 4점 만점에 2.43점에 그쳤다고 보고합니다.[11] WCAG 2.2가 직접 다루지 않는 인지·학습 장애 영역은 여전히 사람의 사용자 조사가 필요하며, AI 자막의 오인식·잘못된 대체 텍스트가 오히려 잘못된 정보를 전달할 수 있다는 점도 함께 지적됩니다.[1] 한국 공공기관에서는 KWCAG 인증을 받은 사이트라도 실제 운영 단계에서 새로 추가된 콘텐츠에 대체 텍스트·자막이 누락되는 사례가 반복적으로 보고되어, 표준 준수가 1회성 인증이 아닌 운영 절차의 일부로 들어와야 한다는 지적이 나옵니다.[2]
진화 방향은 두 갈래로 정리됩니다.
- Apple은 2025년 5월 Live Captions의 한국어를 포함한 다국어 확장과 Apple Watch·Vision Pro 연동을 발표하며, 온디바이스 머신러닝으로 음성 데이터를 외부로 보내지 않는 프라이버시 친화적 자막 처리를 전면화하고 있습니다.[5]
- Google은 Lookout(룩아웃) 앱에 Google DeepMind 비전·언어 모델을 결합한 Image Q&A를 넣어, 대체 텍스트가 없는 이미지에도 사용자가 음성·텍스트로 질문해 색·표정·장면까지 즉석 설명을 받을 수 있게 했습니다.[12] 두 흐름 모두 WCAG·KWCAG 표준 준수를 대체하는 것이 아니라 보완 수단으로 자리잡는 중이며, 한국에서도 소보로 같은 스타트업이 같은 패턴으로 공공·교육·의료 도메인에 적용 범위를 넓히고 있습니다.[6]
- Web Content Accessibility Guidelines (WCAG) 2.2 — 공식 권고안 · W3C · 2023-10-05
- NIA, 정보 취약계층을 위한 웹 접근성 국가표준 개정 — 보도자료 · 한국지능정보사회진흥원 · 2023
- What's New in WCAG 2.2 — 공식 문서 · W3C WAI · 2023
- Apple previews Live Speech, Personal Voice, and more new accessibility features — 공식 발표 · Apple Newsroom · 2023-05-16
- 수어 영상 데이터셋 — 공공 데이터 · AI Hub (NIA) · 2021
- Seeing AI App Launches on Android — 공식 블로그 · Microsoft Accessibility · 2023-12
- Using AI to give people who are blind the "full picture" — 공식 블로그 · Google · 2024
- Investigating Use Cases of AI-Powered Scene Description Applications for Blind and Low Vision People — 학술 논문 · arXiv (CHI 2024) · 2024-03
이 페이지에 대한 의견을 남겨주세요
여러분의 의견은 다음 갱신에 반영됩니다.