기본

ML

머신러닝

AI 기초 분야에서 쓰이는 Machine Learning(기계 학습)의 약자로, 데이터로부터 규칙을 스스로 찾아내도록 컴퓨터를 학습시키는 인공지능 핵심 기법입니다.

쉬운 풀이

머신러닝은 우리말로 "기계 학습"이에요. 프로그래머가 "이런 경우엔 이렇게 하라"는 규칙을 일일이 코드로 짜는 게 아니라, 컴퓨터한테 예제 데이터를 잔뜩 보여주고 "이 안에 들어 있는 규칙을 네가 직접 찾아봐"라고 시키는 방식입니다. 대학교 1학년이 영어 단어를 외울 때, 사전을 통째로 읽는 대신 기출문제 1만 개를 풀고 패턴을 익히는 모습과 비슷해요. 스팸 메일 걸러내기, 유튜브 추천, 카드 부정거래 차단처럼 우리가 매일 마주치는 자동 판단 대부분이 머신러닝으로 돌아가니까, AI를 이해하려면 가장 먼저 알아야 하는 개념입니다.

한 줄 비유

사양서 대신 견적 1만 건을 주고, 가격 산정 규칙을 스스로 뽑아내게 하는 방식입니다.

활용 예시

Case 1

Gmail 스팸 필터 — 지도학습 기반 분류의 교과서 사례

구글 Gmail은 스팸과 정상 메일에 라벨을 붙인 학습 데이터로 분류 모델을 훈련합니다. 학술계에서는 나이브 베이즈(Naive Bayes, 단어 빈도 기반 확률 분류기) 스팸 필터가 1998년 이후 표준 베이스라인으로 자리 잡았고, 단순 구조에도 정확도가 95~99% 수준으로 보고됩니다.^[5] 메일 본문의 단어 빈도, 발신자 이력, 링크 패턴이 입력 변수로 들어가고 출력은 "스팸/정상" 두 값입니다. 라벨 데이터를 모아 분류기를 학습시키는 가장 전형적인 지도학습 적용처입니다.

Case 2

카카오 루빅스(RUBICS) — 머신러닝 기반 뉴스 개인화

카카오는 2015년 6월 다음 모바일 메인 뉴스에 머신러닝 기반 추천 시스템 루빅스(RUBICS, Real-time User Behavior-based Interactive Content recommender System)를 적용했고, 이후 다음 PC·모바일 메인, 카카오톡 채널 등으로 확장했습니다.^[6] 같은 뉴스 면을 모두에게 똑같이 노출하던 편집 방식에서, 이용자별 클릭·체류·재방문 데이터를 학습해 개인별로 다른 면을 보여주는 방식으로 바꿨습니다. 카카오는 추천 엔진 토로스(TOROS)를 다음뉴스·브런치·카카오TV·카카오페이지 등 사내 주요 서비스로 확장 적용해 왔다고 자체 기술 블로그에서 밝힙니다.^[6] 라벨 없는 행동 로그에서 유사 사용자·유사 콘텐츠를 묶는 협업 필터링이 핵심으로, 비지도·반지도 학습이 함께 들어가는 사례입니다.

Case 3

네이버 HyperCLOVA X DASH — 한국어 ML 모델 운영 비용 절감

네이버는 2024년 4월 한국어에 특화된 경량 머신러닝 언어 모델 HyperCLOVA X DASH를 출시했습니다. 파라미터를 줄이면서도 핵심 한국어 평가를 통과하도록 설계해, 기업 입장에서 API 토큰 단가를 기존 HyperCLOVA X 대비 5분의 1 수준으로 낮춰 도입할 수 있게 됐습니다.^[7] 같은 해 8월에는 텍스트와 이미지를 함께 처리하는 HyperCLOVA X Vision을 추가 공개해, 옷 사진과 케어 라벨을 올리면 맞춤 세탁 가이드를 만들어 주는 서비스, 서울시 공공데이터 챗봇 등 외부 적용 사례가 누적되고 있습니다.^[7] 대규모 사전학습 모델을 다른 머신러닝 응용 서비스의 부품으로 공급하는 한국형 사례입니다.

Case 4

신용카드 부정거래 탐지 — 불균형 데이터 분류의 산업 표준

신용카드 부정거래 탐지는 머신러닝의 대표적 산업 적용처입니다. 학술 서베이에 따르면 로지스틱 회귀, 의사결정나무, 랜덤 포레스트, SVM, 신경망 등 ML 기법이 거래 시간·금액·위치·이용 패턴을 입력으로 받아 정상/비정상 확률을 산출합니다.^[8] 정상 거래가 99% 이상이라 데이터 불균형이 심하고, 사기 패턴이 시간에 따라 바뀌는 콘셉트 드리프트(concept drift, 시간 흐름에 따라 입력 분포가 바뀌는 현상)도 운영 과제로 다뤄집니다.^[8] 미국 FTC에 따르면 2024년 신용카드 부정거래 신고는 약 449,000건으로 전년 대비 7.8% 늘었고, 금융사가 사내 리스크 관리 부서에 ML 엔지니어를 두는 이유가 여기 있습니다.^[9]

참고사항

사내에서 반복되는 분류·예측 업무 한 가지를 골라, 라벨이 붙은 과거 데이터가 1,000건 이상 있는지 확인합니다.
입력 변수(피처)와 출력(라벨)을 표로 정리하고, 결측치·중복·이상치 비율을 먼저 점검합니다.
scikit-learn의 LogisticRegression이나 RandomForest 같은 단순 모델로 베이스라인 정답률을 코드 한 줄로 확인합니다.
학습/검증 데이터를 8:2로 나눠 정답률·정밀도·재현율을 분리해 측정하고, 무작위 예측 대비 얼마나 나은지를 비교합니다.
베이스라인이 실무 의사결정에 쓸 수준이 되는지 현업 담당자와 함께 판단한 뒤, 그때 가서 딥러닝·앙상블 같은 고급 기법을 검토합니다.

머신러닝의 한계는 우선 데이터에 종속된다는 점입니다. Stanford CS229 강의 노트와 Tom Mitchell 교과서가 공통으로 강조하듯, 학습 데이터의 편향이 그대로 모델의 편향으로 옮겨가고, 학습 시점 이후의 분포 변화(콘셉트 드리프트)에는 모델이 자동으로 대응하지 못합니다.^[1][2][8] MIT Technology Review가 2023년 발표한 산업 조사 보고서는 "기업이 AI/ML을 도입하면서 가장 큰 장애로 꼽은 것은 모델이 아니라 데이터 품질·인프라·인재 격차"라고 정리했고, 응답 기업의 68%가 자사 인프라가 ML 확산에 충분하지 않다고 답했으며 39%가 인력·재교육 투자를 가장 큰 과제로 꼽았습니다.^[10] 모델 자체보다 데이터 파이프라인과 운영 조직이 병목이라는 시각이 업계에서는 일반적입니다.

진화 방향은 세 갈래로 정리됩니다.

딥러닝(Deep Learning)의 부상으로 전통 ML과 딥러닝의 역할 분담이 명확해졌습니다. 이미지·음성·자연어처럼 비정형 데이터는 딥러닝이, 표 형태의 정형 데이터는 그래디언트 부스팅 같은 전통 ML이 여전히 강세인 구도가 자리 잡았습니다.^[1]
강화학습(Reinforcement Learning)은 거대 언어 모델의 RLHF(Reinforcement Learning from Human Feedback, 사람 피드백으로 강화학습)·추천·광고 입찰·로보틱스로 적용 범위가 넓어졌습니다.^[4]
KAIST 김재철AI대학원은 2019~2023년 ICML·NeurIPS·ICLR 논문 수에서 세계 5위·아시아 1위를 기록했다고 공식 발표했고, 네이버 HyperCLOVA X·LG Exaone처럼 한국형 ML 모델이 상용 단계에 들어서면서 국내 인프라가 빠르게 확충되고 있습니다.^[11][7] 현재 시점에서는 머신러닝이 별도 신기술이라기보다, 사내 데이터로 의사결정을 자동화하는 기본 부품으로 자리 잡고 있다고 봐도 무리가 없습니다.

이 용어와의 관계

유사 개념
Throughput같은 기본 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
Latency같은 기본 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
SWE-bench같은 기본 갈래에서 자주 함께 등장하는 개념입니다.