비즈니스·마케팅

Recommender System

Netflix — 추천 결과가 전체 시청 시간의 80%를 가져옵니다

넷플릭스는 2009년 Netflix Prize에서 행렬 분해 계열 협업 필터링 모델로 RMSE(Root Mean Square Error, 평균 제곱근 오차)를 0.95 → 0.857까지 10% 이상 끌어내린 BellKor's Pragmatic Chaos 팀에 100만 달러를 지급했습니다 ^[2]. 이후 자체 리서치 발표 기준 가입자가 시청한 콘텐츠의 약 80%가 추천에서 시작되고, 나머지 20%만 검색에서 발생합니다 ^[7]. 회사는 추천·개인화의 결합 효과를 연 10억 달러 이상의 가입자 이탈 방지 가치로 환산하고 있습니다 ^[7].

Case 2

쿠팡 — 단순 협업 필터링에서 실시간 개인화 랭킹으로 단계 전환

쿠팡은 2019년 네이버 DEVIEW에서 "쿠팡 추천 시스템 2년간의 변천사 — 상품추천에서 실시간 개인화로"를 발표했습니다 ^[8]. 초기에는 "이 상품을 구매한 고객이 함께 산 상품" 수준의 단순 협업 필터링이었으나, 사용자 세그먼트·선호 가격대·최근 본 상품·검색어를 피처로 결합한 Learning-to-Rank 모델로 전환했습니다 ^[8]. 가격 민감 사용자에게는 할인율 가중치를, 색상 선호가 뚜렷한 사용자에게는 해당 색상 이미지를 먼저 노출하는 식으로 실시간 재정렬합니다 ^[8]. 이후 BERT 기반 임베딩 검색과 GPU 분산 학습으로 학습 파이프라인 속도를 크게 끌어올렸습니다 ^[9].

Case 3

네이버 쇼핑 AiTEMS — 추천 클릭률 45%, 추천 매출 전년 대비 2배 이상

네이버는 자체 개인화 추천 시스템 AiTEMS(에이아이템즈)를 모바일 쇼핑판에 적용한 결과, 쇼핑 이용자의 45%가 추천 상품을 클릭했고 맞춤 추천 매출이 전년 동기 대비 2배 이상 증가했다고 밝혔습니다 ^[10]. 5억여 개 상품 중 인지도가 낮은 신규 상품도 속성 분석을 통해 인기 상품과 동등하게 추천 후보에 올라가는 구조라, 비인기 스토어의 노출 증가 효과도 함께 보고됐습니다 ^[10]. 2023년에는 일본 라인쇼핑에도 같은 임베딩·랭킹 파이프라인이 이식돼 해외 도메인에서 가동 중입니다 ^[11].

Case 4

YouTube·Meta — Two-Tower 딥러닝과 LLM 리랭킹

구글 리서치는 2016년 RecSys 논문에서 YouTube 추천을 "후보 생성 → 랭킹" 2단계 딥러닝 파이프라인으로 정리했고 ^[3], 2019년 RecSys에서는 수억 개 동영상 코퍼스에서 동작하는 Sampling-Bias-Corrected Two-Tower 모델을 공개해 라이브 A/B 개선을 보고했습니다 ^[5]. Meta는 2019년 arXiv에 DLRM(Deep Learning Recommendation Model, 딥러닝 추천 모델)을 공개해 광고·피드 랭킹에 적용 중이며 ^[4], 2024~2025년에는 LLM4Rerank·RecRanker처럼 LLM을 후보 재정렬 단계에 얹어 정확도·다양성·공정성을 동시에 다루는 연구가 ACM·arXiv에 다수 등재됐습니다 ^[6].

오늘 바로 해보기

사내 데이터(주문·열람·검색 로그) 중 사용자-아이템 매트릭스로 변환 가능한 테이블 1개를 추려 봅니다.
*Mining of Massive Datasets* 9장(Recommendation Systems)을 30분 단위로 끊어 협업 필터링·콘텐츠 기반 정의를 노트합니다.
자사 서비스의 "추천 자리"(상세 페이지 하단, 메인 캐러셀 등)를 5개 적고, 각 자리의 KPI를 클릭률·전환율 중 하나로 지정합니다.
오프라인 평가 지표(Precision@K·Recall@K·NDCG) 중 1개를 골라 베이스라인 측정 방식을 한 줄로 정리합니다.
LLM 재정렬 도입 가능성을 점검하기 위해, 후보 100개 → 상위 10개 재정렬 시나리오를 가설로 적어 둡니다.

한계와 진화

한계는 비교적 분명합니다.

콜드 스타트 문제로 신규 사용자·신규 상품은 학습 데이터가 부족해 추천 품질이 떨어집니다 ^[1].
인기 편향(popularity bias)과 필터 버블이 누적돼 추천 결과가 좁아질 수 있고, 2019년 구글 Two-Tower 논문은 in-batch 손실 함수가 인기 상품에 편향되는 문제를 정량적으로 보고하면서 logQ 보정으로 해결했다고 설명합니다 ^[5].
A/B 지표(클릭률·시청 시간)와 사용자의 장기 만족도가 어긋날 수 있다는 점은 학계·산업 양쪽이 반복해 지적해 온 사안입니다 ^[3].
사용자 행동 로그를 광범위하게 다루다 보니 개인정보·프로파일링·필터 버블·차별적 추천에 대한 규제 논의가 EU AI Act·국내 개인정보보호법 양쪽에서 진행 중이며, 추천 사유 공개·옵트아웃 기능 같은 거버넌스 부담이 점차 커지고 있습니다.

진화 방향은 두 축으로 정리됩니다. 하나는 딥러닝 임베딩 표준화입니다 — Meta DLRM·구글 Two-Tower 같은 학습 인프라가 오픈소스로 공개돼 있어 사내 도입 장벽이 낮아졌고, 쿠팡·당근마켓·네이버 같은 국내 대형 플랫폼이 모두 비슷한 2단계 구조를 차용했습니다 ^[4][5][8]. 다른 하나는 LLM 활용입니다 — 2024~2025년 arXiv·ACM에는 LLM4Rerank·RecRanker처럼 후보를 추리는 단계는 기존 모델이 맡고, 최종 상위 N개 재정렬과 추천 이유 생성만 LLM이 담당하는 하이브리드 구조 연구가 다수 발표됐습니다 ^[6]. LLM이 직접 후보를 만들기에는 비용·지연 시간이 크기 때문에, 기존 임베딩 검색을 그대로 둔 채 마지막 한 겹만 얹는 방식이 산업에서 빠르게 자리잡고 있습니다. 현재 시점에서는 협업 필터링 → 딥러닝 임베딩 → LLM 보강이 함께 도는 3중 구조가 산업 표준으로 자리잡고 있다고 보는 시각이 우세합니다.

이 용어와의 관계

유사 개념
LLMO같은 비즈니스·마케팅 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
AI Search같은 비즈니스·마케팅 갈래에서 자주 함께 등장하는 개념입니다.
유사 개념
ChatGPT Search같은 비즈니스·마케팅 갈래에서 자주 함께 등장하는 개념입니다.