AI for Everyone

SEARCH

“음성”7건

액세서빌리티, A11y

AI 활용 분야에서 쓰이는 용어로, 시각·청각·운동·인지 장애가 있는 사용자도 동등하게 디지털 서비스를 쓸 수 있도록 인공지능을 활용해 자막·음성·대체 텍스트를 자동 생성·보완하는 분야입니다.

Voice-First Development

보이스 퍼스트 개발

AI 활용 개발 분야에서 쓰이는 용어로, 키보드 대신 음성을 1차 입력으로 두고 자연어로 설계 의도·요구사항·수정 지시를 던지면 AI가 코드를 완성·실행해 주는 새로운 개발 방식입니다.

AI 활용 분야에서 OpenAI가 2022년에 공개한 오픈소스 음성 인식 모델로, 다국어 음성을 텍스트로 변환하거나 영어로 번역해 자막·전사·음성 비서 기반 기능을 제공합니다.

모델·서비스

일레븐랩스

AI 활용 분야에서 미국 ElevenLabs가 2022년에 공개한 텍스트 음성 합성 서비스로, 글로 입력한 문장을 사람처럼 자연스러운 목소리로 변환하고 다국어 더빙·복제 음성도 제공합니다.

모델·서비스

AI 모델 분야에서 쓰이는 용어로, 텍스트·이미지·음성·영상 같은 여러 형식(modality)을 한 모델이 함께 입력받거나 출력할 수 있도록 만든 인공지능 처리 방식입니다.

제너레이티브 AI

AI 활용 분야에서 쓰이는 용어로, 글·이미지·코드·음성·영상처럼 새로운 콘텐츠를 사람의 요청에 따라 생성해 내는 AI(Artificial Intelligence, 인공지능) 기술 전반을 가리킵니다.

AI 기초 분야에서 쓰이는 용어로, 사람 뇌신경 구조에서 착안한 다층 신경망을 데이터로 학습시켜 사진·음성·문장을 컴퓨터가 직접 인식·생성하게 만든 기계 학습 기법입니다.

검색 · AI for Everyone