도메인을 모르는 AI에게 도메인을 가르치는 도구를 만들었다

AI가 스스로 도메인을 조사하고, 자기가 따를 워크플로우 파이프라인을 설계하고, 그대로 실행해서 결과물까지 만들어내는 Claude Code 스킬 - meta-pipe를 만든 이야기입니다.


도메인을 모르면 AI에게 일을 시키기도 어렵다

AI에게 일을 잘 시키려면, 무엇을 요청해야 하는지 알아야 합니다. 어떤 순서로 진행해야 하는지, 결과물이 제대로 나왔는지 판단하는 것 자체가 도메인 지식을 요구합니다. "카드뉴스 자동화 도구를 만들어줘"라고 해도, 카드뉴스의 판형, 플랫폼별 규격, 가독성 기준을 모르면 제대로 된 지시를 내릴 수가 없습니다.

여기에 또 다른 문제가 있습니다. 도메인마다 필요한 워크플로우 단계가 전혀 다릅니다.

게임 개발     → 기획 → 레벨 디자인 → 프로토타입 → 게임플레이 루프 → 밸런싱 → 배포
핀테크 앱     → 규제 조사 → 보안 설계 → 스키마 → API → UI → 컴플라이언스 검증 → 배포
CLI 도구      → 기능 정의 → 커맨드 구조 → 구현 → 문서화 → 배포
카드뉴스 도구 → 용어 정의 → 데이터 모델 → 템플릿 엔진 → 콘텐츠 파이프라인 → 렌더링 → ...

기존 bkit의 고정된 파이프라인(예: bkit의 웹앱 9단계)으로는 이 다양성을 커버할 수 없습니다. 매번 새 도메인을 만날 때마다 처음부터 조사하고, 설계하고, 실행하는 과정을 사람이 일일이 지시하는 건 비효율적입니다.

그래서 생각했습니다. AI가 스스로 도메인을 조사하고, 스스로 자기가 따라야 할 매뉴얼을 만들면 되지 않을까?


meta-pipe: AI가 스스로 만드는 개발 파이프라인

meta-pipe는 Claude Code 스킬로 구현한 메타 파이프라인입니다. 사용자가 "X를 만들고 싶어"라고 말하면 3단계로 동작합니다:

"카드뉴스 자동화 도구를 만들고 싶어"
  │
  ├─ Phase A: Discover ─── WebSearch로 도메인 조사
  │   → 용어, 워크플로우, 기술 스택, 데이터 모델, 리스크
  │
  ├─ Phase B: Design Pipeline ─── 도메인 맞춤 파이프라인 설계
  │   → 단계 수와 내용이 도메인에 따라 달라짐
  │
  └─ Phase C: Execute ─── 각 단계를 전문가 수준으로 실행
      → 실제 결과물 생성

핵심은 고정된 N단계가 아니라는 것입니다. 게임이면 게임에 맞는 단계가, 핀테크면 핀테크에 맞는 단계가 동적으로 만들어집니다.


실제로 해봤다: 카드뉴스 PoC

말만으로는 검증이 안 되니, "카드뉴스 자동화 도구를 만들고 싶어"라는 입력으로 전체 파이프라인을 돌려봤습니다.

Phase A가 조사한 것

AI가 WebSearch로 카드뉴스 도메인을 5가지 카테고리로 조사했습니다:

카테고리

예시

용어

슬라이드, 판형, CTA, 캐러셀

워크플로우

기획 → 카피 → 디자인 → 리뷰 → 게시

기술 스택

HTML/CSS + Puppeteer, Canvas API

데이터 모델

Project, Slide, Template, StyleGuide

리스크

폰트 라이선스, 이미지 저작권, 플랫폼 규격

Phase B가 설계한 파이프라인

조사 결과를 바탕으로 카드뉴스에 최적화된 8단계 파이프라인이 만들어졌습니다:

#

단계

승인 필요

1

도메인 용어 & 요구사항 정의

O

2

데이터 모델 설계

O

3

템플릿 엔진 설계

-

4

콘텐츠 파이프라인 설계

O

5

렌더링 엔진 구현

-

6

플랫폼 어댑터 & 내보내기

-

7

접근성 & 법적 준수 레이어

O

8

통합 테스트 & 품질 검증

-

"목업", "API 설계", "UI 구현" 같은 웹앱 단계 대신, "템플릿 엔진", "콘텐츠 파이프라인", "접근성 & 법적 준수" 같은 카드뉴스 특화 단계가 들어갔습니다. approval_required 플래그로 핵심 결정(용어, 아키텍처, 법적 리스크)만 사람이 승인하고, 기술 구현은 AI가 자율 실행합니다.

Phase C의 결과물: 실제 카드뉴스 7장

처음에는 8단계 각각의 설계 문서를 생성하는 것을 "테스트 완료"로 생각했습니다. 하지만 아니었습니다. 파이프라인 설계 도구를 테스트한다면, 그 파이프라인을 실행해서 최종 산출물이 나와야 합니다. 설계 문서가 아무리 잘 나와도, 실제 카드뉴스 이미지가 안 나오면 의미가 없습니다.

그래서 HTML/CSS + Puppeteer로 실제 렌더링까지 구현했습니다:

// capture.mjs (핵심 부분)
const browser = await puppeteer.launch({ headless: true });
const page = await browser.newPage();
await page.setViewport({ width: 1080, height: 1080, deviceScaleFactor: 2 });

// Pretendard 한글 폰트를 한 번만 로드
await page.setContent(fontPage, { waitUntil: 'networkidle2' });
await page.evaluateHandle('document.fonts.ready');

// 각 슬라이드를 렌더링
for (const slide of SLIDES) {
  await page.evaluate((html) => {
    document.body.innerHTML = html;
  }, slide.html);

  await page.screenshot({
    path: `${slide.name}.png`,
    clip: { x: 0, y: 0, width: 1080, height: 1080 },
  });
}

결과: 표지 1장, 본문 5장(번호 뱃지 + 제목 + 본문), 마무리 1장. 총 7장의 카드뉴스(2160x2160px @2x)가 생성되었습니다. "카드뉴스 만들고 싶어" 한마디에서 실제 이미지가 나오기까지, 카드뉴스 도메인 지식은 전혀 필요하지 않았습니다.

한국에서 재택근무하다

한국어 텍스트가 있는 페이지

한국어 텍스트가 있는 페이지

한국어 텍스트가 있는 페이지의 스크린샷

한국어 텍스트가 있는 페이지의 스크린샷

파란색 배경에 한글이 적혀 있어요


설계 과정에서 내린 결정들

스킬 구조: 2-tier 지연 로딩

리서치 중 AWS AI-DLC(AI Developer Learning Curve)에서 영감을 받았습니다. 메인 스킬(SKILL.md)에는 진입 로직과 Phase 개요만 두고, 각 Phase의 상세 지침은 별도 파일로 분리해서 해당 Phase에 진입할 때만 로딩합니다.

skills/meta-pipe/
├── SKILL.md              # 메인 (진입 로직 + Phase 개요)
└── references/           # Phase 진입 시에만 로딩
    ├── discovery.md      # Phase A 상세
    ├── pipeline-design.md # Phase B 상세
    └── execution.md      # Phase C 상세

이렇게 하면 컨텍스트 윈도우를 아낄 수 있고, 각 Phase의 지침을 독립적으로 개선할 수 있습니다.

이중 형식 출력

모든 산출물은 마크다운과 JSON 두 형식으로 저장합니다. 마크다운은 사람이 읽고, JSON은 에이전트가 재사용합니다. 같은 도메인을 다시 요청하면 캐시된 JSON을 로딩해서 Phase A를 건너뜁니다.

상태 파일로 일시정지/재개

.meta-pipe-status.json에 현재 진행 상태를 기록합니다. 세션이 끊겨도 다음 세션에서 이어서 작업할 수 있습니다.


한계, 그리고 그 너머

현재 한계: 웹 검색의 깊이

솔직히 AI의 웹 검색은 아주 자세한 수준으로 이루어지지 않습니다. 카드뉴스처럼 비교적 단순한 도메인에서는 충분했지만, 핀테크 규제 체계나 의료 인허가 프로세스 같은 복잡한 도메인에서는 부족할 수 있습니다. 이후에 딥 리서치가 가능한 외부 도구를 연결하면, AI 기본 검색이 못 채우는 나머지 20%를 보완할 수 있을 것으로 봅니다.

표준화가 가져오는 것

meta-pipe가 만드는 워크플로우는 표준화된 형식을 따릅니다. 이것이 중요한 이유가 있습니다.

표준화된 워크플로우를 따르면 결과물도 예측 가능한 구조로 나옵니다. 매번 다른 형태의 산출물이 아니라, 일관된 규칙을 가진 결과물이기 때문에 관리가 쉽습니다. 그리고 같은 표준을 공유하면 AI끼리의 협업도 가능해집니다. 한 AI가 설계한 파이프라인의 중간 산출물을 다른 AI가 이어받아 작업할 수 있습니다.

핵심은 공유 가능한 표준화된 워크플로우를 언제든 스스로 만들 수 있는 능력을 AI에게 주는 것입니다.

더 먼 미래: 엔진으로서의 meta-pipe

meta-pipe는 현재 CLI(Claude Code) 환경에서 동작하는 스킬입니다. 하지만 이 스킬을 엔진으로 두고, 프론트엔드를 렌더링하듯 붙인다면? 사용자가 "카드뉴스 만들고 싶어"라고 입력하면 실시간으로 도메인 조사 → 파이프라인 설계 → 결과물 생성이 일어나는 실시간 SaaS를 만들 수 있지 않을까 생각합니다.


다음 할 일

  • 추가 도메인 테스트 (핀테크, 게임, CLI, 의료)로 파이프라인 품질 검증

  • 딥 리서치 도구 연동으로 복잡한 도메인 조사 품질 향상

  • 캐시 재사용 및 자동 트리거 검증

  • v2.0에서 Hooks 기반 안전장치 강화


아루나의 다른 이야기를 더 보고 싶다면 아래 링크로 접속해 보세요!

https://litt.ly/aluna

5
5개의 답글

뉴스레터 무료 구독

👉 이 게시글도 읽어보세요