카테고리 · 29개 용어
기본
AI를 이해하는 데 꼭 필요한 토대 개념들
TERMS
이 카테고리의 29개 용어
Throughput
쓰루풋
AI 모델 운영 분야에서 쓰이는 용어로, LLM 서비스가 단위 시간당 처리할 수 있는 토큰 양 또는 동시 요청 수를 가리키며, 보통 초당 토큰(TPS) 단위로 측정하는 성능 지표입니다.
Latency
레이턴시
AI 모델 운영 분야에서 쓰이는 용어로, 사용자가 LLM에 질문을 보낸 시점부터 첫 응답 글자가 화면에 뜨기까지 걸리는 시간(보통 ms 단위)을 가리키는 성능 지표입니다.
SWE-bench
AI 모델 평가 분야에서 Princeton NLP팀이 2023년에 공개한 코딩 능력 벤치마크로, 실제 GitHub 이슈와 PR을 모아 LLM이 진짜 오픈소스 버그를 해결할 수 있는지 평가하는 표준 평가입니다.
Benchmark
벤치마크
AI 모델 평가 분야에서 쓰이는 용어로, 서로 다른 인공지능 모델의 성능을 같은 잣대로 비교하기 위해 표준화된 시험 문제집을 모아 정답률·점수로 줄을 세우는 평가 방식입니다.
Closed Model
클로즈드 모델
AI 모델 분야에서 쓰이는 용어로, 학습된 가중치를 공개하지 않고 회사가 API·자체 호스팅으로만 제공하는 LLM 운영 방식을 가리키며, GPT-5·Claude·Gemini 등이 대표적입니다.
Open Weight
오픈 웨이트
AI 모델 분야에서 쓰이는 용어로, 학습된 가중치 파일을 누구나 다운로드해 직접 실행·파인튜닝할 수 있도록 공개한 LLM 운영 방식을 가리키며, Llama·Mistral·Qwen 등이 대표적입니다.
Parameter
파라미터
AI 모델 분야에서 쓰이는 용어로, 학습 단계에서 모델이 데이터를 보고 직접 조정해 저장하는 내부 숫자값으로, 그 갯수가 흔히 "B(빌리언)" 단위로 표시되어 모델 크기를 가늠하는 기준이 됩니다.
Training
트레이닝
AI 모델 분야에서 쓰이는 용어로, 인공지능 모델이 데이터를 입력받아 예측 오차를 줄이는 방향으로 내부 가중치를 반복해서 조정하는 학습 과정 전반을 가리키는 일반 표현입니다.
Inference
인퍼런스
AI 모델 운영 분야에서 쓰이는 용어로, 이미 학습이 끝난 모델이 실제 입력을 받아 결과를 계산해 돌려주는 단계를 가리키며, 사용자가 ChatGPT 같은 서비스에서 답을 받는 순간이 모두 추론입니다.
OCR
AI 활용 분야에서 쓰이는 OCR(Optical Character Recognition, 광학 문자 인식)의 약자로, 이미지·스캔본·사진 속 글자를 컴퓨터가 텍스트로 인식해 검색·편집할 수 있게 변환하는 기술입니다.
NLP
AI 기초 분야에서 쓰이는 Natural Language Processing(자연어 처리)의 약자로, 사람이 쓰는 말과 글을 컴퓨터가 이해하고 다룰 수 있도록 분석·변환·생성하는 기술 분야입니다.
Reasoning Model
추론 모델
AI 모델 분야에서 쓰이는 용어로, 답을 곧장 내놓지 않고 풀이 과정을 내부적으로 길게 생각한 다음 응답하도록 추론 단계를 강화 학습한 LLM 계열입니다.
AI Agent
AI 에이전트
AI 활용 분야에서 쓰이는 Artificial Intelligence(인공지능) Agent의 줄임말로, 사람이 시킨 목표를 달성하기 위해 스스로 계획을 세우고 도구를 호출하며 결과를 검증하는 자율 작업 시스템입니다.
Multimodal
멀티모달
AI 모델 분야에서 쓰이는 용어로, 텍스트·이미지·음성·영상 같은 여러 형식(modality)을 한 모델이 함께 입력받거나 출력할 수 있도록 만든 인공지능 처리 방식입니다.
Vector
벡터
AI 모델 분야에서 쓰이는 용어로, 단어·문장·이미지·코드의 의미를 컴퓨터가 이해하도록 압축한 숫자 묶음으로, 의미가 가까운 항목은 벡터 공간에서 거리도 가까워지도록 학습됩니다.
Pre-training
사전학습
AI 모델 학습 분야에서 쓰이는 용어로, LLM이 대량의 웹·책·코드 텍스트를 미리 읽으며 단어 사이의 통계 관계를 익히는 첫 번째 학습 단계로, 모델의 기초 언어 능력이 만들어지는 과정입니다.
Hallucination
할루시네이션, 환각
AI 모델 신뢰성 분야에서 쓰이는 용어로, LLM이 사실과 다른 정보를 마치 사실인 듯 자연스럽게 생성해 출력하는 현상을 가리킵니다.
Context Window
컨텍스트 윈도우
AI 활용 분야에서 쓰이는 용어로, LLM이 한 번의 대화·요청에서 동시에 기억하고 처리할 수 있는 입력과 출력의 최대 토큰 수를 가리키며, 긴 문서 분석·코드 베이스 이해의 한계를 결정합니다.
Generative AI
제너레이티브 AI
AI 활용 분야에서 쓰이는 용어로, 글·이미지·코드·음성·영상처럼 새로운 콘텐츠를 사람의 요청에 따라 생성해 내는 AI(Artificial Intelligence, 인공지능) 기술 전반을 가리킵니다.
Transformer
트랜스포머
AI 기초 분야에서 쓰이는 용어로, 2017년 구글 연구진이 발표한 신경망 구조로, 문장 안 모든 단어가 서로 어떤 관계인지 한 번에 계산하는 셀프 어텐션 방식으로 동작합니다.
SLM
AI 모델 분야에서 쓰이는 Small Language Model(소형 언어 모델)의 약자로, 적은 메모리·전력으로도 로컬 단말이나 서버에서 빠르게 동작하도록 만든 소규모 인공지능 모델입니다.
LLM
AI 모델 분야에서 쓰이는 Large Language Model(거대 언어 모델)의 약자로, 수천억 단어의 텍스트를 미리 학습해 사람의 질문에 자연스럽게 답할 수 있도록 만든 대규모 인공지능 모델입니다.
Neural Network
뉴럴 네트워크
AI 기초 분야에서 쓰이는 용어로, 사람 뇌의 뉴런이 신호를 주고받는 구조에서 착안해 입력값을 여러 층의 노드를 거쳐 변환·예측하도록 만든 인공지능 핵심 모델 구조입니다.
Deep Learning
딥러닝
AI 기초 분야에서 쓰이는 용어로, 사람 뇌신경 구조에서 착안한 다층 신경망을 데이터로 학습시켜 사진·음성·문장을 컴퓨터가 직접 인식·생성하게 만든 기계 학습 기법입니다.
ML
머신러닝
AI 기초 분야에서 쓰이는 Machine Learning(기계 학습)의 약자로, 데이터로부터 규칙을 스스로 찾아내도록 컴퓨터를 학습시키는 인공지능 핵심 기법입니다.
AI
인공지능
기술 분야 전반에 쓰이는 Artificial Intelligence(인공지능)의 약자로, 사람의 학습·추론·인식·언어 능력을 기계가 흉내 내거나 일부 능가하도록 만든 기술 분야입니다.
Token
토큰
AI 기초 분야에서 쓰이는 용어로, LLM이 사람의 문장을 처리할 때 사용하는 최소 단위로, 단어보다 작은 음절이나 조각으로 잘려 모델 입력·출력 길이와 비용을 계산하는 기준이 됩니다.
Embedding
임베딩
AI 기초 분야에서 쓰이는 용어로, 문장·이미지·코드 같은 데이터를 컴퓨터가 이해할 수 있는 숫자 벡터로 변환해 의미가 비슷한 항목끼리 가깝게 배치하는 표현 방식입니다.
Diffusion
디퓨전
AI 모델 분야에서 쓰이는 용어로, 무작위 노이즈를 단계적으로 걸러내며 이미지를 만들어 내도록 설계한 생성 모델 구조로, Stable Diffusion·DALL·E·Sora·Veo의 핵심 알고리즘입니다.