모델·서비스

ElevenLabs

일레븐랩스

AI 활용 분야에서 미국 ElevenLabs가 2022년에 공개한 텍스트 음성 합성 서비스로, 글로 입력한 문장을 사람처럼 자연스러운 목소리로 변환하고 다국어 더빙·복제 음성도 제공합니다.

쉬운 풀이

ElevenLabs는 글로 적은 대본을 사람 목소리에 가까운 음성으로 바꿔 주는 AI 서비스인데, 자기 목소리를 30초만 녹음해 올리면 그 목소리로 다른 외국어를 읽어 주는 기능까지 함께 제공합니다. 조별 발표 영상을 만들 때 친구가 영어 내레이션을 부탁받았는데, 본인이 직접 녹음하지 않고도 자기 목소리 그대로 영어·일본어 버전을 뽑아 낼 수 있는 정도예요. 콜센터 응대·오디오북 제작·게임 캐릭터 더빙처럼 "사람이 말해야만 했던 일"이 어디까지 자동으로 넘어가는지 가늠해 보기에 좋은 서비스입니다.

한 줄 비유
사내 성우실을 클라우드 API로 외주 주는 격입니다.
활용 예시
Case 1

HarperCollins — 비영어권 오디오북 자동 제작

세계적 출판사 HarperCollins는 2024년 11월 ElevenLabs와 파트너십을 맺고, 영어 외 시장에서 오디오북을 자동 생성하기로 했습니다 [4]. 백리스트(구간 도서) 중 오디오 버전이 없던 책을 대상으로, 약 1시간 안에 한 권의 오디오북을 만드는 구조입니다 [4]. 단, 인간 성우 기반 제작을 대체하지 않고 보완하는 용도라고 회사 측은 명시했습니다 [4].

Case 2

크래프톤·MBC C&I·SBS·ESTsoft — 한국 미디어·게임사 파일럿

ElevenLabs는 2025년 11월 21일 서울 JW 메리어트에서 한국 공식 진출을 발표했고, MBC C&I·크래프톤·ESTsoft·SBS 등과 음성 AI 기반 제작 비용·시간을 줄이는 파일럿을 준비 중이라고 밝혔습니다 [5]. 크래프톤과는 게임 플레이 중 캐릭터와 사용자가 실시간으로 대화하는 인터랙티브 더빙 데모를 함께 만들고 있고, 플랫폼에는 이미 약 400개의 한국어 보이스가 등록돼 있습니다 [5]. 회사는 K드라마·뉴스·게임 캐릭터용 감정형 보이스를 추가 공급할 계획이라고 설명했습니다 [5].

Case 3

한 디지털 은행 — 콜센터 자동화

한국 진출 발표 자료에서 회사는 한 디지털 은행 콜센터 사례를 소개했습니다 [5]. 음성 AI 도입 후 고객 문의 1건당 응대 시간이 15분에서 2분으로 단축됐고, 카드 관련 문의의 50%를 AI 에이전트가 자체 처리했습니다 [5]. ElevenAgents 계열 대화형 에이전트가 적용된 형태로, 출시 두 달 만에 전 세계 개발자들이 25만 개 이상의 음성 에이전트를 만들었다는 시리즈 C 발표와 같은 흐름입니다 [1].

Case 4

Paradox Interactive — 게임 캐릭터 음성 생성

스웨덴 게임사 Paradox Interactive(시티즈: 스카이라인 II, 스텔라리스 제작사)는 자사 게임 캐릭터 음성 제작에 ElevenLabs를 채택했다고 TechCrunch가 보도했습니다 [6]. 회사는 게임 엔진과 연동되는 저지연 API를 통해 NPC 대사·해설·튜토리얼 음성을 직접 합성할 수 있도록 했고, Unreal Engine·Unity 플러그인을 별도로 공급합니다 [7]. 같은 흐름으로 임팩트 프로그램(Impact Program)을 통해 ALS(루게릭병) 등 발화 장애를 가진 1,000명 이상에게 본인의 옛 음성을 복원해 무상 제공해 왔습니다 [1].

참고사항
  1. elevenlabs.io에서 무료 계정을 만들고 Text-to-Speech 페이지에서 한국어 샘플 보이스 5개를 비교 청취합니다.
  2. 회사 소개 1분 분량 한국어 스크립트를 입력해 Multilingual v2 모델로 음성을 뽑고, 같은 문장을 영어·일본어로 더빙해 톤 차이를 확인합니다.
  3. Voice Library에서 한국어 PVC(전문 보이스 클로닝) 보이스를 필터링해 사내 광고 시안용 후보 2~3개를 골라 둡니다.
  4. Conversational AI(ElevenAgents)에서 FAQ 응대용 데모 에이전트를 1개 만들고, 답변 지연 시간과 어색한 끊김을 체크리스트로 정리합니다.
  5. Studio의 더빙 기능에 영어 영상 1분을 넣어 한국어 더빙본을 만들고, 입 모양 싱크·고유명사 발음 오류를 사내 리뷰용으로 캡처합니다.

한국어는 단어 자체보다 문장 맥락·어투·높임이 감정을 전달하는 언어입니다. CEO Mati Staniszewski는 한국 진출 간담회에서 "한국어는 단순 변환 대상이 아니라 별도 모델 훈련·보정이 필요했다"고 밝혔습니다 [5]. 영어권 데이터에 최적화된 초기 모델은 한국어 사투리·억양·감정 재현에 한계가 있었고, 회사는 이를 풀기 위해 한국어 발성·사투리 코칭 팀을 내부에 구성했다고 설명했습니다 [5]. 또 음성 복제 기술 특성상 사칭·딥페이크 위험도 상존해, 회사는 워터마크·실시간 탐지 도구·동의 기반 보이스 등록 절차를 도입했고 시리즈 C 자금 일부를 AI 안전 연구에 배정했다고 발표했습니다 [3]. 학술계에서도 합성 음성으로 인한 보이스 피싱·정치 광고 악용 사례가 보고되고 있어, 도입 단계에서 콘텐츠 검토 프로세스를 함께 설계하라는 권고가 따라옵니다 [3].

기술 방향은 표현력 강화와 다국어 확장 두 축입니다. 시리즈 C 이후 공개한 Eleven v3 모델은 호흡·감정·멈춤까지 반영하는 방향으로 진화 중이고, 출시 두 달 만에 25만 개 이상의 대화형 에이전트가 만들어졌습니다 [1]. 사업 측면에서는 2023년 1월 베타 출시 후 약 20개월 만에 ARR(연간 반복 매출) 1억 달러를 돌파했고, 2026년 1월 기준 ARR 3억 3,000만 달러를 넘겼다고 회사가 밝혔습니다 [8]. 같은 성장 속도에 힘입어 2026년 2월에는 Series D로 5억 달러를 추가 조달하며 평가액을 110억 달러로 끌어올렸고, 향후 IPO를 검토하고 있다고 외신은 보도했습니다 [3]. 회사는 한국을 시작으로 일본·동남아·미국 시장으로 감정형 더빙과 실시간 음성 번역을 순차 확장하고, 음성을 "디지털 상호작용의 기본 단위"로 만든다는 미션을 내걸고 있습니다 [3].

이 용어와의 관계
  • 유사 개념
    Fireworks AI같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.
  • 유사 개념
    Together AI같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.
  • 유사 개념
    Groq같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.
관련 태그
참고 자료
  1. ElevenLabs raises $180M Series C — 회사 공식 발표 · ElevenLabs Blog · 2025-01-30
  2. Scribe v2 — Speech to Text — 제품 공식 페이지 · ElevenLabs · 2025
  3. ElevenLabs confirms $180M in Series C funding at a $3.3B valuation — 권위 매체 · TechCrunch · 2025-01-30
  4. HarperCollins and ElevenLabs AI to create audiobooks for foreign titles — 권위 매체 · The Bookseller · 2024-11
  5. 일레븐랩스, "한국어, 단순 번역 아닌 '표현 AI'가 핵심" — 권위 매체 · MS투데이 · 2025-11-24
  6. ElevenLabs CEO says the voice AI startup crossed $330M ARR last year — 권위 매체 · TechCrunch · 2026-01-13
  7. AI audio startup ElevenLabs triples valuation to $3.3B with $180M Series C — 권위 매체 · PitchBook · 2025-01-30
  8. Listen to your favorite books and articles voiced by icons — 회사 공식 발표 · ElevenLabs Blog · 2024
대표 출처회사 공식 발표 (2025) — ElevenLabs raises $180M Series C