0. 결론 먼저
1인 개발·기획·테스트를 며칠 안에 끝내야 하는 상황이라면 정식 PRD → 모듈 분할 → 복잡한 전처리가 반드시 필요한가?
아니었다. PDF를 그대로 멀티모달 LLM(Gemini 2.5 Flash)에 보내 얻은 단순 파이프라인이 속도·품질·안정성 모두에서 앞섰다.
1. 배경과 목적
항목
내용
서비스
Storyming – RAG 기반 Q&A
요구
피치덱·사업계획서(PDF·PPTX)를 슬라이드 단위 요약·태깅·내러티브 단계로 구조화
목표
자동 파이프라인을 만들어 고품질 학습 데이터를 빠르게 확보
2. 두 가지 접근 방식
2-1.
복잡한 방식 (처음 선택)
Full PRD 작성: 문제·유저스토리·모듈·NFR·메트릭까지 세분화
PDF → PNG 변환(슬라이드별) → 이미지 오브젝트 31장 생성
이미지 5장씩 배치 호출 → Gemini Vision
JSON 결과 병합 → 후처리
의도: 이미지 OCR 정확도·확장성 확보
현실:
변환 36 s(처리시간 79 %)
PNG 버퍼 12 MB·코드 10+ 모듈
변환 실패·병합 오류 다발
2-2.
간단한 방식(전환 후)
PDF를 그대로 Gemini 2.5 Flash에 업로드
단 일 프롬프트로 전체 슬라이드 요약·태그·단계까지 JSON 요청
결과 파일 저장 → 바로 인덱싱
장점
35.5 s(22 % 단축)
메모리 < 2 MB, 코드 1파일
오류 0, 맥락·개선점까지 포함된 분석
3. 실제 프롬프트 요약
You are SlideAnalyzer.
Return JSON only:
{
"overall": { "message": "...", "audience": "...", "strengths": [...], "weaknesses": [...] },
"slides": [
{ "no": 1, "header": "...", "summary_kr": "...", "tags": ["..."], "stage": "Hook" }
]
}
Rules:
1. Korean summaries.
2. Null when unknown.
3. Valid JSON only.한 번 호출로 전체 요약 + 슬라이드 배열을 동시에 수집 → 후처리 로직이 json.loads() 한 줄.
4. 테스트 문서 & 결과
테스트 파일
유형
슬라이드 수
결과
Cheil Idea Festival 수상작 A
마케팅 캠페인 피치덱
31
슬라이드 전부 정확히 태깅·단계 구분
Cheil Idea Festival 수상작 B
마케팅 캠페인 피치덱
30
강점·약점 6 / 3 항목 추출
Cheil Idea Festival 수상작 C
마케팅 캠페인 피치덱
27
Hook→Ask 6단계 내러티브 완전 매핑
5. 비교 결과 (요약표)
항목
복잡한 방식
간단한 방식
총 처리 시간
45.4 s
35.5 s
변환·전처리
PNG 36 s
없음
메모리
12 MB
< 2 MB
코드 규모
10+ 모듈
단일 스크립트
오류 빈도
변환·병합 오류
0
분석 품질
슬라이드 1장 샘플 분석
전체 맥락·개선점 포함
6. 배운 점
Lean Spec → 빠른 실험 → 필요 시 확장
작은 PoC에 Full PRD