GPTaku
GPTaku
⚔️ 베테랑 파트너
🚀 SNS 챌린지 달성자

바이브코딩을 한다면 PRD 꼭 필요할까? – SlideAnalysis 자동화 워크플로우 실험기

0. 결론 먼저

1인 개발·기획·테스트를 며칠 안에 끝내야 하는 상황이라면 정식 PRD → 모듈 분할 → 복잡한 전처리가 반드시 필요한가?

아니었다. PDF를 그대로 멀티모달 LLM(Gemini 2.5 Flash)에 보내 얻은 단순 파이프라인이 속도·품질·안정성 모두에서 앞섰다.


1. 배경과 목적

항목

내용

서비스

Storyming – RAG 기반 Q&A

요구

피치덱·사업계획서(PDF·PPTX)를 슬라이드 단위 요약·태깅·내러티브 단계로 구조화

목표

자동 파이프라인을 만들어 고품질 학습 데이터를 빠르게 확보


2. 두 가지 접근 방식

2-1. 

복잡한 방식 (처음 선택)

  1. Full PRD 작성: 문제·유저스토리·모듈·NFR·메트릭까지 세분화

  2. PDF → PNG 변환(슬라이드별) → 이미지 오브젝트 31장 생성

  3. 이미지 5장씩 배치 호출 → Gemini Vision

  4. JSON 결과 병합 → 후처리

의도: 이미지 OCR 정확도·확장성 확보

현실:

  • 변환 36 s(처리시간 79 %)

  • PNG 버퍼 12 MB·코드 10+ 모듈

  • 변환 실패·병합 오류 다발


2-2. 

간단한 방식(전환 후)

  1. PDF를 그대로 Gemini 2.5 Flash에 업로드

  2. 단일 프롬프트로 전체 슬라이드 요약·태그·단계까지 JSON 요청

  3. 결과 파일 저장 → 바로 인덱싱

장점

  • 35.5 s(22 % 단축)

  • 메모리 < 2 MB, 코드 1파일

  • 오류 0, 맥락·개선점까지 포함된 분석


3. 실제 프롬프트 요약

You are SlideAnalyzer.

Return JSON only:
{
  "overall": { "message": "...", "audience": "...", "strengths": [...], "weaknesses": [...] },
  "slides": [
    { "no": 1, "header": "...", "summary_kr": "...", "tags": ["..."], "stage": "Hook" }
  ]
}

Rules:
1. Korean summaries.
2. Null when unknown.
3. Valid JSON only.

한 번 호출로 전체 요약 + 슬라이드 배열을 동시에 수집 → 후처리 로직이 json.loads() 한 줄.


4. 테스트 문서 & 결과

테스트 파일

유형

슬라이드 수

결과

Cheil Idea Festival 수상작 A

마케팅 캠페인 피치덱

31

슬라이드 전부 정확히 태깅·단계 구분

Cheil Idea Festival 수상작 B

마케팅 캠페인 피치덱

30

강점·약점 6 / 3 항목 추출

Cheil Idea Festival 수상작 C

마케팅 캠페인 피치덱

27

Hook→Ask 6단계 내러티브 완전 매핑


5. 비교 결과 (요약표)

항목

복잡한 방식

간단한 방식

총 처리 시간

45.4 s

35.5 s

변환·전처리

PNG 36 s

없음

메모리

12 MB

< 2 MB

코드 규모

10+ 모듈

단일 스크립트

오류 빈도

변환·병합 오류

0

분석 품질

슬라이드 1장 샘플 분석

전체 맥락·개선점 포함


6. 배운 점

  1. Lean Spec → 빠른 실험 → 필요 시 확장

    작은 PoC에 Full PRD는 과한 오버헤드였다.

  2. 멀티모달 LLM 능력 신뢰

    최신 모델은 PDF 텍스트·레이아웃·이미지를 통합 이해한다.

  3. “가능한 가장 짧은 경로”부터 증명

    불필요한 복잡도(이미지 변환, 배치 호출)는 시간·오류·비용을 키운다.

  4. 명확한 JSON 스키마 요구만으로도 품질 관리 가능

    모델이 구조를 보장하면 후처리 로직이 극단적으로 단순해진다.


7. 다음 단계

  1. 폴더 감시 – 신규 PDF 감지 → 자동 분석·인덱싱

  2. 스키마 확장 – 감정 점수, 톤 필드를 추가해 응답 다양화

  3. 비용 로깅 – 토큰 사용량 집계 → 월 예산 알림

  4. Storyming E2E 테스트 – 사용자 질문 → 근거 슬라이드 → 재요약 → 응답까지 검증


핵심 메시지 한 줄

작은 자동화 도구“가장 짧은 경로를 먼저 검증” 하고, 필요할 때만 복잡도를 추가하라.

4

👉 이 게시글도 읽어보세요