Vibe Engineering
바이브 엔지니어링
AI 활용 분야에서 쓰이는 용어로, Vibe Coding을 코딩 너머 시스템 설계·운영·CI/CD·문서화 같은 엔지니어링 전 영역으로 확장해 의도 중심의 자연어 지시만으로 작업을 처리하는 방식을 가리킵니다.
Vibe Engineering은 "AI에게 코드뿐 아니라 설계도·운영 매뉴얼·배포 절차까지 한 번에 맡기되, 사람이 사양과 검수를 책임지는 작업 방식"이에요. 조별 과제에서 발표 자료 한 챕터만 맡기는 게 Vibe Coding이라면, 주제 선정·자료 조사·발표 자료·발표 리허설까지 통째로 위임하는 대신 결과물을 한 줄씩 점검하고 사인하는 흐름이 Vibe Engineering입니다. 한 줄짜리 자동완성 도구로 시작했던 AI 개발이 사양·테스트·문서까지 묶인 워크플로우로 자리 잡고 있다는 점에서 알아둘 만한 개념이에요.
가속 페달은 깊게 밟되 안전벨트·브레이크·정비기록은 그대로 챙기는 운전입니다.
Anthropic — 시니어 엔지니어의 병렬 에이전트 운영
Willison은 같은 글에서 "신뢰할 만한 시니어들이 여러 에이전트를 동시에 돌리며 병렬로 문제를 해결하고 있다"라고 적었습니다.[1] 본인도 Claude Code 여러 인스턴스를 같이 돌리는 방식을 시도했고, "정신적으로는 지치지만 효과적"이라고 평가했습니다.[3] 사양 작성, QA 설계, 코드리뷰가 일과의 대부분을 차지하는 구조로 업무 흐름이 바뀝니다. 사내 시니어 엔지니어의 KPI를 PR 수에서 사양·검토 품질로 옮길 때 참고할 만합니다.
CJ올리브영 — AI-DLC 워크숍 3일 만에 5개 과제 프로토타입
AWS 한국 기술 블로그가 2026년 5월 공개한 CJ올리브영 사례입니다. 본사 테크 조직 30여 명이 AWS AI-DLC(AI-Driven Development Life Cycle) 방법론과 Kiro Custom Agent를 도입해 24개 후보 중 5개 과제를 골라 3일 간 워크숍을 진행했습니다.[4] Inception 단계에서 요구사항·설계 문서를 충분히 정제한 뒤 Construction 단계에서 Unit 단위로 코드와 테스트를 생성하는 구조입니다. 사내 표준 개발 프로세스 안에서 AI를 도입할 때 참고할 만한 모델입니다.
Stripe·Wiz — 시제품에서 프로덕션 마이그레이션으로 전환
Anthropic 공식 자료에 따르면 Stripe는 Claude Code를 1,370명 엔지니어 전원에 배포했고, 한 팀은 1만 줄 Scala → Java 마이그레이션을 기존 추정 10인-주에서 4일로 단축했습니다.[5] 보안 기업 Wiz는 5만 줄 Python → Go 라이브러리 전환을 약 20시간 만에 완료했다고 보고했습니다.[5] Vibe Coding처럼 던져 놓고 끝내는 것이 아니라 테스트·검증·코드리뷰를 통과시켜 실제 결제와 보안 시스템에 합쳐졌다는 점에서 Vibe Engineering의 모범 사례로 인용됩니다.
토스 — LLM 멀티 에이전트로 보안 취약점 자동 분석
토스 기술 블로그가 공개한 사내 보안 자동화 사례입니다. 수백 개 서비스를 매일 분석할 때 상용 모델로는 월 수백만 원이 발생하자 자체 호스팅 오픈 모델로 비용을 거의 0에 가깝게 낮추고, Supervisor·Discovery·Analysis 세 역할로 멀티 에이전트 파이프라인을 구성했습니다.[6] 단순히 LLM에 코드를 던지는 것이 아니라 에이전트별 책임·로그·검증 단계를 정의했다는 점이 Vibe Engineering의 색채입니다. 사내 보안·운영 자동화에 LLM을 도입하려는 한국 팀이 직접 비교할 만한 구조입니다.
- 현재 사이드 프로젝트의 테스트 커버리지를 확인하고 핵심 경로 3개에 자동 테스트를 추가합니다
- 코딩 에이전트에 작업을 맡기기 전에 "스펙 → 계획 → 구현 → 테스트" 순서로 한 페이지 계획서를 먼저 작성합니다
- 프로젝트 루트에 CLAUDE.md 또는 AGENTS.md를 두고 코드 컨벤션·금지 사항·도메인 용어를 정리해 둡니다
- 에이전트가 만든 PR은 직접 diff 검토를 하고, 같은 모델에 "이 변경의 약점 5가지를 짚어라"라는 셀프 리뷰를 한 번 더 돌립니다
- 보안·결제·권한 같은 시스템 경계 결정은 사람이 최종 승인하는 게이트를 워크플로우에 명시적으로 둡니다
권위 출처가 공통으로 지적하는 한계는 두 가지입니다.
- 들쭉날쭉한 모델 성능입니다. Willison은 "에이전트가 테스트를 안 돌려놓고 동작한다고 주장하기도 한다"라며, 견고한 테스트 스위트가 없으면 무관한 기능을 깨뜨리고도 모를 수 있다고 적었습니다.[1] 같은 글에서 그는 "신뢰할 수 있는 자동 테스트가 없는 코드베이스에서는 LLM 사용을 권하지 않는다"라고도 명시했습니다.[1]
- 명명 자체에 대한 회의입니다. Willison 본인이 글에서 "이름이 좀 멍청한가? 아마 그럴 것이다"라고 인정했고[1], 2026년 2월 23일 업데이트에서 "Agentic Engineering"이 우세해지는 추세라고 직접 표기했습니다.[1] 한국 현장에서도 토스 사례처럼 단순한 코드 생성이 아니라 멀티 에이전트 파이프라인을 별도로 설계해야 하는 운영 부담이 함께 따라옵니다.[6]
진화 방향은 두 갈래입니다. 한쪽은 용어 통합 — 같은 작업 방식이 Agentic Engineering으로 흡수되고 있고[1], Andrej Karpathy도 2025년 4월 트윗에서 "내가 진짜 신경 쓰는 코드"에 대해 컨텍스트 적재·계획·테스트를 명시적으로 분리하는 리듬을 설명하면서 같은 흐름에 합류했습니다.[8] 다른 한쪽은 방법론화 — AWS는 AI-DLC라는 단계별 워크플로우와 Kiro Steering 파일로 조직 단위 표준을 제시하며 "특정 개인 역량이 아니라 프로세스가 품질을 보장하는 구조"를 강조했습니다.[4] Anthropic도 Stripe·Wiz 사례를 공식 자료로 정리하면서 시제품 단계의 Vibe Coding과 달리 프로덕션 마이그레이션에서는 테스트·검증·코드리뷰가 묶인 워크플로우가 표준이라고 못 박았습니다.[5] 현재 시점에서는 "사람이 사양·검토·경계를 쥐고, AI가 실행과 반복을 맡는다"라는 분업이 업계 표준에 가깝고, 시니어 엔지니어의 좋은 습관이 도구의 진화와 함께 더 중요해지는 흐름입니다.[1][7]
- 유사 개념Adaptive Reasoning같은 AI 트렌드 갈래에서 자주 함께 등장하는 개념입니다.
- 유사 개념Extended Thinking같은 AI 트렌드 갈래에서 자주 함께 등장하는 개념입니다.
- 유사 개념Prompt Caching같은 AI 트렌드 갈래에서 자주 함께 등장하는 개념입니다.
- Vibe engineering — 1차 출처 · Simon Willison's Weblog · 2025.10.07 (2026.02.23 업데이트)
- Andrej Karpathy on "vibe coding" — 1차 출처 · X · 2025.02.02
- Embracing the parallel coding agent lifestyle — 1차 출처 · Simon Willison's Weblog · 2025.10.05
- CJ올리브영의 AI 협업 개발 프로세스 구축, AI-DLC 실전 도입 사례 — 기업 공식 기술 블로그 · AWS Korea · 2026.05.19
- Claude Code by Anthropic — 공식 제품 문서 · Anthropic · 2026
- LLM을 이용한 서비스 취약점 분석 자동화 #2 — 기업 공식 기술 블로그 · Toss Tech · 2025
- Designing agentic loops — 1차 출처 · Simon Willison's Weblog · 2025.09.30
- Andrej Karpathy on AI-assisted coding rhythm — 1차 출처 · X · 2025.04
이 페이지가 도움이 되었나요?
제안·수정 요청은 meet@percent.ac 로 보내주시면 다음 갱신에 반영합니다.