Replicate
레플리케이트
AI 인프라 분야에서 미국 Replicate가 2019년에 창업해 운영하는 모델 호스팅 플랫폼으로, 오픈웨이트 LLM·이미지·영상 모델을 API 한 줄로 호출해 쓸 수 있게 해줍니다.
Replicate는 외부에 공개된 AI 모델을 직접 GPU 서버에 설치하지 않고 인터넷 주소(API)를 호출해서 바로 쓰게 해 주는 클라우드 서비스예요. 동아리에서 이미지 생성기를 만들어 보고 싶을 때 보통 GPU 서버를 빌리고 모델 가중치를 내려받고 환경을 맞추느라 하루를 쓰는데, Replicate는 모델 카드의 "Run" 버튼이나 한 줄짜리 코드만 있으면 같은 작업을 1분 안에 끝낼 수 있습니다. 5만 개가 넘는 오픈소스 모델이 같은 규격으로 정리돼 있어 초기 시안 검증과 단가 추정에 자주 쓰여요.
오픈소스 모델을 사내 GPU 대신 외주 클라우드에 맡기는 모델 단가 견적서.
Buzzfeed — Stable Diffusion 기반 사내 이미지 생성 워크플로
TechCrunch 보도에 따르면 Buzzfeed를 비롯한 미디어·콘텐츠 기업이 Replicate를 통해 Stable Diffusion 계열 모델을 호출해 기사 삽화·썸네일을 사내에서 직접 생성하는 워크플로를 구축했습니다.[3] GPU 서버를 자체 구매·운영하는 대신 Replicate 가격 페이지에 명시된 출력 단위 과금(FLUX schnell 이미지 1장 $0.003) 구조를 그대로 적용해, 시안 100장 생성 단가를 견적 단계에서 바로 산출할 수 있게 됐습니다.[7] 사내 GPU 인프라 없이 텍스트→이미지 기능을 제품에 붙여야 하는 미디어·이커머스 팀이 첫 도입 대상으로 보고됩니다.[3]
한국 사례 — Jini Books, 고객 맞춤 도서 제작
한국어 기술 가이드에 따르면 한국 스타트업 Jini Books가 Replicate API를 활용해 고객별 맞춤형 도서를 제작합니다. 본문 일러스트·표지 이미지를 주문 단위로 즉시 생성해야 하는 워크플로에서, 자체 GPU 인프라 없이 표지·삽화 모델을 같은 API 규격으로 호출하는 구조를 채택했습니다.[8] 같은 가이드는 한국 개발자가 환경 설정·서버 구축 없이 텍스트 생성·이미지 생성·영상 변환을 한 계정으로 묶어 쓰는 표준 경로로 Replicate를 소개합니다.[8] 1인 출판·소형 콘텐츠 스튜디오가 GPU 구매 없이 PoC를 검증하는 영역입니다.
Cog 컨테이너 표준 — 연구팀 자체 모델 배포
연구팀이 학습한 모델을 사내 GPU 대신 Replicate에 푸시해 전용 엔드포인트를 받는 워크플로입니다. 공식 GitHub 리포지터리에 따르면 Cog는 cog.yaml 한 파일로 CUDA·cuDNN·PyTorch 조합을 자동 매칭하고 Docker 이미지를 빌드해, cog push 한 줄로 API 서버가 만들어집니다.[4] Cog는 Apache 2.0 라이선스로 GitHub Star 9,300개·기여자 89명을 보유한 오픈소스 프로젝트로, Stable Diffusion 공식 컨테이너도 Cog 포맷으로 배포됐습니다.[4][9] TechCrunch 인터뷰에 따르면 Replicate는 이 패키징 표준을 무기로 ML 모델 호스팅의 진입 장벽을 낮추는 전략을 취해 왔습니다.[3]
Cloudflare 인수 — 글로벌 AI 클라우드 통합 경로
Cloudflare 공식 보도자료에 따르면 2025년 11월 17일 Cloudflare가 Replicate 인수를 발표했고, 2026년 초 거래가 종료됐습니다.[6] 거래 후에도 Replicate 브랜드는 독립 운영을 유지하면서 Cloudflare Workers AI와 통합돼, 전 세계 어디서나 단일 코드 한 줄로 AI 모델을 호출할 수 있는 인프라가 됩니다.[6] CTOL 한국어 보도에 따르면 인수 가격은 최대 5억 5,000만 달러 수준으로 추정되며, Amazon Bedrock·Google Vertex AI와 직접 경쟁하는 구도로 전환됐습니다.[10] 글로벌 엔터프라이즈가 단일 인프라에서 5만 개 이상 모델을 호출하려는 영역에서 도입 검토 대상이 됐습니다.[6]
- replicate.com 가입 후 Explore에서 FLUX·Whisper·Stable Diffusion 모델 카드를 1건씩 확인합니다.
- FLUX schnell 모델 페이지의 "Run" 버튼으로 한국어 프롬프트를 1건 실행해 단가를 확인합니다.
- API Token을 발급한 뒤 Python 또는 Node.js 클라이언트로 모델 1개를 코드에서 호출합니다.
- 가격 페이지에서 CPU·T4·A100·H100 초당 단가를 비교해 워크로드 견적을 산출합니다.
- github.com/replicate/cog 리포지터리의 getting-started 문서로 더미 모델을 1건 패키징해 푸시 실습을 합니다.
공식 문서에 따르면 공유 GPU 풀에서 돌아가는 퍼블릭 모델은 트래픽이 몰리면 콜드 스타트가 발생해 첫 응답 지연이 변동될 수 있습니다.[7] 프라이빗 모델은 전용 인스턴스로 격리되지만 셋업·유휴 시간까지 과금돼, 부하가 낮은 시간대에도 비용이 누적되는 구조입니다.[7] 2026년 시점 비교 자료에서는 직접 GPU 임대 대비 단가가 의미 있게 높을 수 있다는 평가가 이어지고 있어, 트래픽이 일정 규모를 넘긴 뒤에는 자체 호스팅이나 Modal·RunPod 같은 다른 GPU 클라우드와의 단가 비교가 도입 검토 항목으로 자리잡았습니다.[11] 한국어 커뮤니티의 실사용 후기에서도 모델 핸들링 자유도가 직접 운영 대비 제한적이라는 평가가 일부 보고됩니다.[8]
진화 방향은 세 갈래로 정리됩니다.
- Cloudflare 인수에 따른 엣지 네트워크 통합입니다. Cloudflare 공식 보도자료에 따르면 인수 후 Replicate는 Cloudflare의 글로벌 엣지 네트워크와 Workers AI 위에서 호출할 수 있게 되고, 5만 개 이상 모델을 단일 코드 한 줄로 부르는 "AI 인프라 표준"을 목표로 한다고 명시했습니다.[6]
- 멀티모델 게이트웨이로의 확장입니다. 가격 페이지에는 Anthropic Claude·DeepSeek R1·Ideogram v3·Wan 2.1·Veo 등 상용·오픈 모델이 함께 등록돼 있어, 단순 오픈소스 마켓플레이스에서 멀티모델 API 게이트웨이로 영역이 넓어지는 흐름이 확인됩니다.[7][12]
- 엔터프라이즈 기능 강화입니다. Andreessen Horowitz 발표문은 시리즈 B 자금을 보안·컴플라이언스·모니터링 등 엔터프라이즈 기능 강화에 쓴다고 밝혔고, 이 방향은 인수 후에도 이어지는 것으로 보고됩니다.[5][6]
- 유사 개념Fireworks AI같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.
- 유사 개념Together AI같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.
- 유사 개념Groq같은 모델·서비스 갈래에서 자주 함께 등장하는 개념입니다.
- Replicate – Run AI with an API — 회사 공식 사이트 · replicate.com
- replicate/cog: Containers for machine learning — 회사 공식 리포지터리 · GitHub
- Replicate wants to take the pain out of running and hosting ML models — 권위 매체 · TechCrunch · 2023-02-21
- Open-Source AI Platform Replicate Raises $40M From a16z — 권위 매체 · Maginative · 2023-12
- Run FLUX with an API — 회사 공식 블로그 · replicate.com
- Pricing – Replicate — 회사 공식 문서 · replicate.com
- Replicate API: 누구나 쉽게 AI 모델을 활용하는 방법 — 한국어 기술 가이드 · 2024-12
- Partnering with Replicate: Machine Learning, Simplified — 권위 매체 · Sequoia Capital · 2023
- Open source at Replicate — 회사 공식 문서 · replicate.com
- Replicate: Run machine learning models in the cloud — 회사 공식 프로필 · Y Combinator
이 페이지가 도움이 되었나요?
제안·수정 요청은 meet@percent.ac 로 보내주시면 다음 갱신에 반영합니다.