에이전틱 엔지니어링이란? 카파시가 말한 바이브 코딩 다음 단계 7가지

에이전틱 엔지니어링(Agentic Engineering)은 AI 에이전트를 조율해 프로 수준의 품질 기준을 지키면서 개발 속도를 끌어올리는 엔지니어링 방식입니다. '바이브 코딩(Vibe Coding)'이라는 말을 만든 안드레이 카파시(Andrej Karpathy)가 그 다음 단계로 직접 제시한 개념입니다.

카파시는 최근 한 대담에서 "프로그래머로서 이렇게까지 뒤처진 느낌을 받은 적이 없다"고 말했습니다. OpenAI 공동 창업자이자 테슬라 오토파일럿을 작동시킨 인물이 던진 말이라 더 무게가 있습니다. 이 글에서는 그 대담의 핵심 인사이트를 7가지로 정리합니다.

Photo by Growtika on Unsplash

이 글을 읽으면

바이브 코딩과 에이전틱 엔지니어링이 어떻게 다른지, 그리고 AI 시대에 개발자가 무엇에 집중해야 하는지를 카파시의 관점으로 정리할 수 있습니다.

1. 2025년 12월이 진짜 변곡점이었다

카파시는 변화의 시점을 구체적으로 짚습니다. 그는 1년 넘게 에이전트 도구를 써왔지만, 모델이 만들어내는 코드 덩어리를 종종 직접 고쳐야 했습니다. 그런데 2025년 12월부터 양상이 달라졌습니다.

최신 모델로 넘어오면서 코드 덩어리가 "그냥 멀쩡하게" 나오기 시작했고, 더 요청해도 계속 멀쩡했습니다. 마지막으로 코드를 고친 게 언제인지 기억나지 않는 지점에 도달하자, 그는 시스템을 점점 더 신뢰하게 됐고 결국 완전히 바이브 코딩으로 넘어갔습니다.

핵심은 이게 점진적 개선이 아니라 뚜렷한 전환점이었다는 점입니다. 카파시는 많은 사람이 2025년의 AI를 'ChatGPT 비슷한 무언가'로 경험했지만, 12월 시점에 다시 봤어야 한다고 강조합니다. 특히 에이전트가 일관된 워크플로우를 끝까지 끌고 가는 능력이 그때 실제로 작동하기 시작했습니다.

2. 소프트웨어 3.0 — 프롬프트가 곧 프로그래밍이다

카파시는 소프트웨어의 진화를 세 단계로 나눕니다.

소프트웨어 1.0: 사람이 직접 코드를 작성
소프트웨어 2.0: 데이터셋과 신경망을 학습시켜 프로그래밍
소프트웨어 3.0: 프롬프트와 컨텍스트로 LLM이라는 '해석기'를 프로그래밍

3.0에서는 컨텍스트 창에 무엇을 넣느냐가 곧 프로그래밍이 됩니다. LLM이 그 컨텍스트를 해석해 디지털 정보 공간에서 연산을 수행하기 때문입니다.

카파시는 OpenClaw 설치 사례를 듭니다. 예전이라면 여러 플랫폼을 지원하느라 비대해진 셸 스크립트를 짜야 했습니다. 하지만 지금의 설치는 "이 텍스트를 복사해서 에이전트에게 주세요" 한 줄로 끝납니다. 에이전트가 환경을 살펴보고 알아서 디버깅하며 설치를 마칩니다. 모든 세부사항을 정확히 명세할 필요가 사라진 것입니다.

3. 원래 존재할 필요 없던 코드가 사라진다

가장 인상적인 사례는 카파시가 만든 'MenuGen'입니다. 식당 메뉴판을 사진으로 찍으면 각 메뉴가 어떤 음식인지 이미지로 보여주는 앱입니다.

그는 이 앱을 직접 코딩했습니다. 사진 업로드, OCR로 메뉴명 추출, 이미지 생성기로 음식 사진 생성, Vercel 배포까지 전부 엮었습니다. 그런데 소프트웨어 3.0 버전은 충격적으로 단순했습니다. 사진을 제미나이(Gemini)에 주고 "나노 바나나(Nano Banana)로 메뉴판 위에 음식 이미지를 입혀줘"라고 말하면 끝입니다.

나노 바나나는 찍은 메뉴판 사진 그대로, 픽셀 안에 각 음식 이미지를 렌더링해 돌려줬습니다. 카파시의 결론은 이렇습니다. "내 MenuGen 전체가 불필요하다. 그 앱은 존재하지 말았어야 한다."

여기서 더 나아가, 그는 이것이 '코드가 빨라지는' 이야기가 아니라고 선을 긋습니다. 예전 코드는 구조화된 데이터 위에서만 동작했지만, 이제는 LLM 지식 베이스 프로젝트처럼 '예전엔 만들 수 없던 것'이 가능해졌습니다. 문서 더미를 다른 방식으로 재컴파일해 위키를 만드는 일은, 이전 패러다임에는 아예 존재할 수 없던 작업입니다.

Photo by Ilya Pavlov on Unsplash

4. 검증 가능성(Verifiability)이 자동화 속도를 결정한다

카파시는 무엇이 빨리 자동화되는지를 '검증 가능성'으로 설명합니다.

전통적 컴퓨터는 코드로 명세할 수 있는 것을 자동화했습니다.
최신 LLM은 검증할 수 있는 것을 자동화합니다.

이유는 학습 방식에 있습니다. 프런티어 연구소들은 거대한 강화학습 환경에서 모델을 훈련하며 검증 가능한 보상을 줍니다. 그 결과 수학·코드처럼 검증이 쉬운 영역에서 능력이 폭발적으로 치솟고, 그 외 영역은 거칠게 남습니다.

여기서 중요한 부분이 하나 더 있습니다. 능력은 연구소가 어떤 데이터를 데이터 분포에 넣었는지에도 좌우됩니다. 카파시는 GPT-3.5에서 GPT-4로 넘어갈 때 체스 실력이 크게 는 사례를 듭니다. 단순한 능력 향상이 아니라, 누군가 대량의 체스 데이터를 사전학습 세트에 넣었기 때문이라는 것입니다. 우리는 어느 정도 '연구소가 무엇을 넣었는가'에 좌우되는 셈입니다.

5. 들쭉날쭉한 지능 — '동물'이 아니라 '유령'을 소환하는 것

카파시가 즐겨 드는 예시가 있습니다. 최신 모델에게 "50m 떨어진 세차장에 차를 가지고 갈까, 걸어갈까?"라고 물으면, 너무 가깝다며 걸어가라고 답합니다.

10만 줄 코드베이스를 리팩터링하고 제로데이 취약점을 찾아내는 Opus 4.7급 모델이, 동시에 이런 어이없는 답을 내놓습니다. 카파시는 이 들쭉날쭉함(jaggedness)을 모델을 이해하는 핵심으로 봅니다.

그는 우리가 '동물'을 만드는 게 아니라 '유령'을 소환하고 있다고 표현합니다. 진화로 다듬어진 동물 지능과 달리, LLM은 데이터와 보상 함수로 형성된 통계적 시뮬레이션 회로입니다. 그래서 야단친다고 더 잘하지 않습니다. 이 점을 받아들여야 모델을 제대로 다룰 수 있습니다. RL이 닿은 회로 안에 있으면 날아다니지만, 분포를 벗어나면 직접 파인튜닝을 고민해야 합니다.

6. 바이브 코딩 vs 에이전틱 엔지니어링

이 글의 핵심입니다. 카파시는 둘을 명확히 구분합니다.

구분바이브 코딩에이전틱 엔지니어링목적누구나 할 수 있게 '바닥을 올림'프로 수준 '품질 기준 유지'책임일단 만들어보는 감각보안·품질에 여전히 책임대상모두엔지니어링 규율을 갖춘 사람결과무엇이든 만들 수 있음품질을 지키며 훨씬 빠르게

바이브 코딩은 모두의 바닥을 올립니다. 누구나 무엇이든 코딩할 수 있게 됐고, 그 자체로 놀라운 일입니다. 반면 에이전틱 엔지니어링은 기존 프로 소프트웨어의 품질 기준을 지키는 일입니다. 바이브 코딩을 한다고 취약점을 끼워 넣어도 되는 건 아닙니다. 소프트웨어에 대한 책임은 그대로이되, 더 빠르게 가는 방법을 제대로 찾는 것입니다.

카파시는 이를 하나의 엔지니어링 규율로 봅니다. 에이전트는 강력하지만 들쭉날쭉하고 확률적인 존재입니다. 이들을 어떻게 조율해 품질을 떨어뜨리지 않고 가속할 것인가가 에이전틱 엔지니어링의 영역입니다. 그는 과거의 '10배 엔지니어'를 언급하며, 이걸 잘하는 사람은 10배를 훨씬 넘어선다고 말합니다.

7. 사람은 '이해'를 외주 줄 수 없다

에이전트가 더 많은 일을 할수록, 사람에게는 무엇이 더 중요해질까요. 카파시의 답은 취향, 판단, 스펙 설계, 그리고 오버사이트입니다.

그는 MenuGen에서 겪은 버그를 예로 듭니다. 에이전트가 Stripe 결제 이메일과 구글 로그인 이메일을 기준으로 사용자를 매칭하려 해서, 서로 다른 이메일을 쓰면 결제가 연결되지 않는 문제가 생겼습니다. "왜 임의로 바뀔 수 있는 이메일로 자금을 연결하려 하지?" 같은 판단은 여전히 사람의 몫입니다. 고유 사용자 ID로 묶어야 한다는 설계는 사람이 잡아줘야 합니다.

API 세부사항은 에이전트가 채웁니다. 카파시는 PyTorch와 NumPy의 keepdims냐 keepdim이냐, dim이냐 axis냐를 더 이상 외우지 않는다고 말합니다. 그건 기억력 좋은 인턴(에이전트)이 처리할 일입니다. 대신 사람은 무엇을, 왜 만드는지를 쥐고 있어야 합니다.

그가 가장 마음에 들어 한 트윗은 이것입니다. "사고는 외주 줄 수 있어도, 이해는 외주 줄 수 없다." 정보는 여전히 사람의 뇌를 통과해야 하고, 방향을 잡으려면 이해가 전제돼야 합니다. 그래서 카파시는 글을 읽을 때마다 자신만의 위키를 쌓고, 같은 정보를 다른 각도로 재구성하며 이해를 강화한다고 합니다.

Photo by Steve Johnson on Unsplash

마무리

카파시의 메시지는 한 문장으로 요약됩니다. 바이브 코딩이 바닥을 올렸다면, 에이전틱 엔지니어링은 천장을 끌어올린다. 그리고 그 천장은 취향과 이해, 즉 사람만이 책임질 수 있는 영역에서 결정됩니다.

도구를 최대한 활용하고, 자신만의 셋업에 투자하고, 에이전트가 깰 수 없는 견고한 시스템을 설계하는 사람. 카파시가 그리는 'AI 네이티브 엔지니어'의 모습입니다.

💡 한 발 더 — 나의 생각

카파시의 대담에서 개발자가 아닌 콘텐츠·마케팅 실무자가 가져갈 인사이트가 따로 있습니다. 그가 강조한 '검증 가능성'과 '에이전트 네이티브 인프라'는 코드 밖에서도 그대로 적용됩니다.

마케팅 업무 중 검증 가능한 것부터 자동화가 빨라집니다. 예를 들어 UTM 규칙 준수, 카피의 글자 수 제한, 키워드 카니발라이제이션 체크처럼 '맞고 틀림'이 명확한 작업은 에이전트가 안정적으로 처리합니다. 반대로 '이 카피가 우리 브랜드 톤에 맞나' 같은 취향의 영역은 카파시 말대로 여전히 사람이 쥐고 있어야 합니다. 자동화 우선순위를 정할 때 이 기준이 꽤 쓸모 있습니다.

또 하나, 카파시가 "문서가 왜 아직도 사람한테 시키느냐, 에이전트에 복사할 텍스트를 달라"고 한 대목은 우리 콘텐츠에도 시사점을 줍니다. 앞으로 AI가 인용하는 콘텐츠가 늘어날수록, 사람이 읽기 좋은 글뿐 아니라 AI가 그대로 인용하기 좋은 구조(정의형 첫 문장, FAQ, 구조화된 데이터)가 검색·유입에 직접 영향을 줍니다. 실제로 지피터스에서도 AI 플랫폼 유입은 작지만 유일하게 성장하는 채널입니다. 카파시의 '에이전트 네이티브'는 개발 인프라만의 이야기가 아니라, 콘텐츠 전략의 방향이기도 합니다.

마지막으로 "이해는 외주 줄 수 없다"는 문장은 AI 시대 학습에 대한 가장 정직한 가이드라고 생각합니다. 도구가 아무리 좋아져도, 무엇을 왜 만드는지 모르면 좋은 디렉터가 될 수 없습니다. 결국 에이전트를 잘 쓰는 능력의 바닥에는 '내가 이 일을 얼마나 이해하고 있는가'가 깔려 있습니다.

원문: Andrej Karpathy: From Vibe Coding to Agentic Engineering (YouTube)