SEARCH
“음성”7건
Accessibility
액세서빌리티, A11y
AI 활용 분야에서 쓰이는 용어로, 시각·청각·운동·인지 장애가 있는 사용자도 동등하게 디지털 서비스를 쓸 수 있도록 인공지능을 활용해 자막·음성·대체 텍스트를 자동 생성·보완하는 분야입니다.
디자인
Voice-First Development
보이스 퍼스트 개발
AI 활용 개발 분야에서 쓰이는 용어로, 키보드 대신 음성을 1차 입력으로 두고 자연어로 설계 의도·요구사항·수정 지시를 던지면 AI가 코드를 완성·실행해 주는 새로운 개발 방식입니다.
AI 트렌드
Whisper
위스퍼
AI 활용 분야에서 OpenAI가 2022년에 공개한 오픈소스 음성 인식 모델로, 다국어 음성을 텍스트로 변환하거나 영어로 번역해 자막·전사·음성 비서 기반 기능을 제공합니다.
모델·서비스
ElevenLabs
일레븐랩스
AI 활용 분야에서 미국 ElevenLabs가 2022년에 공개한 텍스트 음성 합성 서비스로, 글로 입력한 문장을 사람처럼 자연스러운 목소리로 변환하고 다국어 더빙·복제 음성도 제공합니다.
모델·서비스
Multimodal
멀티모달
AI 모델 분야에서 쓰이는 용어로, 텍스트·이미지·음성·영상 같은 여러 형식(modality)을 한 모델이 함께 입력받거나 출력할 수 있도록 만든 인공지능 처리 방식입니다.
기본
Generative AI
제너레이티브 AI
AI 활용 분야에서 쓰이는 용어로, 글·이미지·코드·음성·영상처럼 새로운 콘텐츠를 사람의 요청에 따라 생성해 내는 AI(Artificial Intelligence, 인공지능) 기술 전반을 가리킵니다.
기본
Deep Learning
딥러닝
AI 기초 분야에서 쓰이는 용어로, 사람 뇌신경 구조에서 착안한 다층 신경망을 데이터로 학습시켜 사진·음성·문장을 컴퓨터가 직접 인식·생성하게 만든 기계 학습 기법입니다.
기본