
"코드를 직접 안 친다"는 게 가능한 일이에요?
처음 이 말을 들었을 때 솔직히 반신반의했어요.
"Django를 만든 25년차 엔지니어가 코드의 95%를 직접 안 친다고?" 그게 자랑인지 고백인지 헷갈렸거든요. 그런데 사이먼 윌리슨이 레니 팟캐스트(Lenny's Podcast)에 나와서 직접 한 말이에요. 해변에서 강아지 산책시키면서 핸드폰으로 코딩 에이전트 2~3개를 돌리고, 본인은 방향만 지시한다고요.
개발자라면 이 말이 위협처럼 들릴 수도 있고, 기획자나 PO라면 기회처럼 들릴 수도 있어요. 오늘 글에서는 사이먼이 공유한 에이전틱 엔지니어링(Agentic Engineering)의 핵심을 정리해볼게요. 개발자뿐 아니라 스타트업 창업가, 제품 기획자라면 꼭 읽어봐야 할 내용이에요.
에이전틱 엔지니어링, 바이브 코딩이랑 뭐가 달라요?
요즘 바이브 코딩(Vibe Coding)이라는 말을 많이 들어보셨을 거예요.
ChatGPT나 Claude한테 "이런 기능 만들어줘"라고 하고, 결과물이 대충 돌아가면 "됐다" 하고 넘어가는 방식이에요. 빠르긴 한데, 결과물이 어떻게 만들어졌는지 본인도 모르고, 문제가 생기면 고치기도 어려워요.
에이전틱 엔지니어링은 달라요. AI 에이전트가 코드를 계획하고, 작성하고, 테스트하고, 배포하는 전체 과정을 구조화해서 설계하는 방법론이에요. 쉽게 말하면 AI를 단순히 사용하는 게 아니라, AI 팀원을 어떻게 운영할지를 설계하는 능력이에요. AI를 잘 쓰는 사람이 아니라, AI를 잘 이끄는 사람이 되는 거예요.
2025년 11월, 뭔가 달라졌다는 느낌
사이먼은 2025년 11월을 변곡점이라고 불러요.
Anthropic의 Claude Code가 등장하고, 주요 AI 모델들이 특정 임계값을 넘어서면서 코딩 에이전트의 신뢰도가 확 달라졌다는 거예요. 그 이전까지 코딩 에이전트는 "시킨 건 하는데 눈 떼기 무서운 인턴" 같은 느낌이었어요. 대충은 돌아가는데 결과물을 믿기 어려웠거든요.
변곡점 이후는 달라요. "거의 항상 시킨 대로 한다"는 수준이 됐어요. 토들러에서 신뢰할 수 있는 팀원으로 바뀐 거예요. 실제로 AI가 혼자 처리할 수 있는 작업 길이가 2년 만에 30초에서 4시간으로 늘었다는 데이터(Epoch AI / METR)도 있어요. 더 이상 짧은 심부름만 시킬 수 있는 게 아닌 거죠.
왜 코딩이 가장 먼저 바뀌는 걸까요
Anthropic Economic Index에 따르면 사람들이 AI에게 가장 많이 맡기는 일은 코딩이에요. 전체 AI 대화의 37%를 차지한다고 해요. 글쓰기나 분석을 압도하는 수치예요.
이유는 단순해요. 코드는 맞고 틀림이 명확하거든요. 실행하면 되는지 안 되는지 바로 나와요. 에세이나 법률 서류는 "잘 됐는지"를 판단하기 훨씬 어렵죠. 사이먼은 코드가 선행 지표(bellwether)라고 표현해요. 코딩에서 먼저 일어난 일이 다른 모든 지식 노동 분야로 퍼져나갈 거라는 거예요. 보험 심사, 의료 진단 보조, 법률 계약서 검토, 모두 같은 경로를 따를 거예요.
실제 회사들은 어디까지 갔을까요, 다크 팩토리 이야기
"다크 팩토리(Dark Factory)"라는 개념을 들어보셨나요?
공장 자동화에서 온 말이에요. 완전 자동화된 공장은 사람이 없으니까 불을 꺼도 돼요. 기계는 어둠 속에서도 돌아가니까요. 보안 회사 StrongDM이 이걸 소프트웨어 개발에 실제로 적용하고 있어요. 규칙이 딱 두 개예요. 아무도 코드를 직접 타이핑하지 않고, 아무도 코드를 읽지 않아요.
"그러면 제대로 돌아가는지 어떻게 알아요?"라는 질문이 당연히 나오죠. 이 회사의 답은 AI로 시뮬레이션된 QA 팀이에요. 수백 명의 가상 직원이 24시간 시뮬레이션 환경에서 테스트를 돌려요. 하루 비용이 약 1,400만 원 수준이었다고 해요. 비싸 보이지만 잠을 안 자는 QA팀을 운영하는 비용이라고 보면 완전히 다른 계산이 나오죠. 이게 2025년 8월부터 실제 운영 중인 이야기예요.
에이전틱 엔지니어링, 나는 어떻게 시작하면 될까요
사이먼이 정리한 실전 패턴 4가지를 공유할게요.
첫 번째는 프로토타이핑을 공짜로 만드는 거예요. 기능 하나를 디자인할 때 예전에는 한 가지 방식만 검토했다면, 지금은 세 가지 방식으로 프로토타입을 동시에 만들어요. 시간이 거의 안 걸리거든요. 기획자라면 바이브 코딩으로 프로토타입을 안 만들고 있다면 지금 가장 강력한 부스트를 놓치고 있는 거예요.
두 번째는 호딩(Hoarding) 전략이에요. 됐던 것, 안 됐던 것 모두 백로그로 쌓아두는 거예요. 사이먼은 GitHub에 193개의 작은 도구와 리서치 프로젝트를 모아두고, 새 문제가 나오면 기존 것들을 조합해서 풀어요. AI가 이 호딩을 훨씬 쉽게 만들어줘요.
세 번째는 테스트를 절대 포기하지 않는 거예요. TDD(테스트 주도 개발)를 에이전트에 적용하면 품질이 확 달라져요. 프롬프트에 "red/green TDD"라고만 써도 에이전트가 테스트를 먼저 작성하고 실패를 확인한 다음 코드를 구현해요. 이 5초짜리 타이핑이 결과물 품질을 바꿔요.
네 번째는 좋은 템플릿으로 시작하는 거예요. 에이전트는 이미 있는 코드의 스타일을 따라 하는 능력이 탁월해요. 새 직원한테 보고서 써와라고 하면 형식이 뒤죽박죽이지만, 기존 보고서 샘플 하나만 주면 그대로 따르는 것과 같아요.
사람들이 가장 원하지만 아직 없는 것, 개인 AI 비서
OpenClaw(오픈클로)라는 오픈소스 프로젝트가 있어요.
모든 이메일에 접근하고 대신 행동을 취하는 개인 AI 비서예요. 2025년 11월에 첫 코드가 올라갔고, 3개월 반 만에 슈퍼볼 광고에 등장했어요. 수십만 명이 복잡한 API 설정을 감수하면서까지 써요. 보안 문제로 실제 피해를 본 사람도 있는데도 불구하고요.
이게 보여주는 건 하나예요. 사람들이 개인 디지털 비서를 얼마나 간절히 원하는지예요. 사이먼은 "안전한 OpenClaw를 만들 수 있다면 그게 지금 AI에서 가장 큰 기회"라고 말해요. 아직 아무도 안전하게 만드는 방법을 몰라서 못 만들고 있는 거거든요.
개발자가 아닌 나도 이걸 알아야 하는 이유
에이전틱 엔지니어링이 가장 먼저 코딩에 적용됐지만, 이건 개발자만의 이야기가 아니에요.
사이먼 본인이 말했듯 코드는 선행 지표예요. 보험 업계 심사, 의료 진단 보조, 법률 계약서 검토, 이 모든 분야가 코딩과 같은 경로로 바뀌어 갈 거예요. 생성형 AI 도입으로 개발자 생산성이 30% 향상됐다면, 에이전틱 AI 도입 이후에는 200% 향상됐다는 보고도 나오고 있어요.
기획자, PO, 스타트업 창업가라면 지금 당장 해야 할 게 있어요. AI를 사용하는 단계를 넘어서, AI를 운영하는 방법을 배워야 해요. 에이전트에게 어떻게 지시할지, 어떻게 검증할지, 어떤 템플릿으로 시작할지를 설계하는 능력이요.
마무리
코드가 공짜가 됐다는 건, 코드 자체의 가치가 떨어진 게 아니에요.
더 많은 코드를 더 빠르게 만들 수 있게 됐으니까, 무엇을 만들지 결정하는 능력이 더 중요해진 거예요. 사이먼이 25년간 쌓아온 경쟁 우위는 빠른 프로토타이핑이었어요. 그런데 그게 이제 공짜가 됐어요. 앞으로 진짜 비싸지는 것은 판단력이에요. 어떤 프로토타입이 맞는 방향인지, 어떤 에이전트 결과물이 실제로 배포해도 되는지 판단하는 경험과 맥락은 AI가 대신할 수 없어요.
에이전트를 이끄는 사람이 되거나, 에이전트에 대체되는 사람이 되거나. 지금 이 선택의 시간이 생각보다 빠르게 다가오고 있어요.
'IT > AI' 카테고리의 다른 글
| 🤖 AI가 세상을 다시 먹고 있다 — 이번엔 '일' 자체를 (0) | 2026.06.02 |
|---|---|
| 🤖 무료 챗GPT와 유료 챗GPT, 사실 같은 제품이 아니에요 (0) | 2026.06.02 |
| 🤔 AI가 사무직을 없앤다고? "태스크"와 "직업"은 다르다 (0) | 2026.06.01 |
| AI 팀장이 시장에 졌다? 멀티 에이전트 설계의 반전 실험 (1) | 2026.06.01 |
| AI가 틀린 판단을 내리는 이유, WRING이 해결책일까요? (1) | 2026.05.31 |