[Claude Code] 주제 하나 던졌더니 3부작 숏폼이 나왔다 - 영상 자동화 후기

## 📝 한줄 요약

강의용 교육 콘텐츠가 필요해서 Claude Code에게 주제 하나를 던졌더니, 스크립트부터 이미지, 음성, 영상까지 자동으로 만들어주는 파이프라인이 완성됐습니다.

## 🎯 이런 분들께 도움돼요

- 숏폼 영상을 빠르게 만들고 싶은 유튜버, 인스타그래머

- 교육용 시리즈 콘텐츠를 제작해야 하는 강사, 기획자

- 영상 편집 툴 없이 콘텐츠를 만들어보고 싶은 분

## 😫 문제 상황 (Before)

"맞춤형자동화" 스터디 1주차 강의를 다시 보기로 듣고 스터디장 허세임님의 지도에 따라 무조건 따라하기로 하고 내 상황에 맞게 구성해보았습니다

강의 기획을 준비하면서 교육용 숏폼 시리즈가 필요했습니다. "딥페이크 보이스피싱 막는 법" 같은 주제로 3부작 영상을 만들고 싶었는데, 문제는 기획 능력과 시간이었습니다.

숏폼 하나를 만들려면:

- 스크립트 작성

- 이미지/영상 소스 준비

- 음성 녹음 또는 TTS

- 영상 편집

- 자막 작업

이걸 3부작으로 만들면 작업량이 3배. 주제를 바꿔서 다른 시리즈도 만들고 싶은데, 매번 이 과정을 반복하기엔 너무 오래 걸렸습니다.

## 🛠️ 사용한 도구

- 메인 도구: Claude Code (CLI)

- 모델: Claude Opus 4.5

- 연동 API: Google Gemini 2.5 Pro (스크립트), Imagen 4.0 (이미지 생성)

- 기타: Python, gTTS (음성), MoviePy (영상 편집)

---

## 🔧 작업 과정

### 프로젝트 세팅 - "폴더 만들어줘"로 시작

처음엔 단순하게 시작했습니다. 숏폼 제작용 폴더를 만들어달라고 했더니, Claude가 프로젝트 구조까지 잡아줬습니다.

> shortform-producer 폴더에 숏폼 제작 스킬 파일들을 생성해줘. config.json, gemini_image_gen.py 등 5개 파일

Claude는 단순히 빈 파일을 만든 게 아니라, 설정 파일에 캐릭터 정보, 영상 규격(9:16), 에피소드 구조까지 미리 설계해뒀습니다. config.json을 열어보니 "RAK-DO"라는 40대 한국인 남성 캐릭터가 이미 정의되어 있었고, 픽사 스타일 3D 애니메이션으로 그려달라는 프롬프트까지 들어있었습니다.

---

### 3부작 구조가 알아서 나왔다 - 이게 놀라웠음

주제 하나만 입력했을 뿐인데, 시리즈 구조가 자동으로 설계됐습니다.

> python main_agent.py "딥페이크 보이스피싱 막는 법"

결과물을 보니:

- 1부: "이게 뭔데?" - 문제 인식 및 현황 소개

- 2부: "이렇게 당한다" - 실제 사례 및 수법 분석

- 3부: "이렇게 막아라" - 예방법 및 대응 방법

각 에피소드마다 5개 씬, 씬마다 나레이션과 이미지 프롬프트가 자동 생성됐습니다. "단 3초면 목소리 복제", "가족 목소리와 100% 일치" 같은 후킹 문구까지 들어있었습니다.

직접 구조를 짜려면 한참 고민했을 텐데, 주제만 던졌더니 교육 콘텐츠에 맞는 흐름이 바로 나왔습니다.

---

### 한글 깨짐 문제 - 이건 좀 막혔다

이미지 생성 단계에서 문제가 생겼습니다. Gemini Imagen으로 이미지를 만들었는데, 이미지 안에 들어간 한글 텍스트가 전부 깨져서 나왔습니다.

> 이미지 생성 내 한글이 모두 깨져 있는 상황을 수정해야해

Claude가 바로 해결책을 제시했습니다. AI 이미지 생성 모델들은 한글을 제대로 렌더링하지 못하는 경우가 많다고 합니다. 그래서:

1. 이미지 프롬프트에서 한글 텍스트 완전히 제외 ("Do not include any text or Korean characters")

2. 자막은 별도로 Pillow 라이브러리로 이미지 위에 오버레이

이렇게 분리하니까 한글 자막이 깔끔하게 들어갔습니다. 이 팁은 AI 이미지 생성할 때 꼭 기억해두면 좋을 것 같습니다.

---

### 영상 완성 - 스크립트부터 MP4까지

마지막으로 음성과 영상 생성을 요청했습니다.

> 모두 수정 완료 이제 숏폼 영상을 만들어

Claude가 추가로 만들어준 것들:

- add_voice.py - Google TTS로 나레이션 음성 자동 생성

- create_video.py - 이미지 + 음성을 합쳐서 MP4로 만들기

- add_subtitle.py - 자막 파일 생성 및 영상에 합성

최종적으로 3개의 MP4 파일이 output 폴더에 생성됐습니다:

- episode_01_final.mp4

- episode_02_final.mp4

- episode_03_final.mp4

---

## ✅ 결과 (After)

### Before vs After

| 항 목 | Before | After |

| 작업 방식 | 스크립트, 이미지, 편집 각각 수작업 | 주제 입력 → 자동 생성 |

| 시리즈 확장 | 주제마다 처음부터 다시 | 주제만 바꾸면 같은 포맷으로 양산 |

| 필요한 툴 | 영상 편집 프로그램 필수 | Python 스크립트만으로 완성 |

### 결과물

- 3부작 교육용 숏폼 시리즈 완성

- 각 에피소드 5개 씬, 약 15초 분량

- RAK-DO 캐릭터 이미지 15장 + 썸네일 3장

- 재사용 가능한 자동화 파이프라인

## 💬 이 과정에서 배운 AI 활용 팁

### 효과적이었던 것

1. 시리즈 구조를 먼저 설계하게 하기 - "3부작으로 만들어줘"라고 하면 Claude가 에피소드별 포커스를 알아서 잡아줍니다

2. 설정 파일로 일관성 유지 - 캐릭터, 영상 규격 등을 config.json에 정의해두면 매번 설명할 필요 없음

3. 문제가 생기면 바로 말하기 - "한글이 깨져요"라고 했더니 해결책이 바로 나왔음

### 이렇게 하면 안 돼요

1. AI 이미지에 한글 텍스트 포함시키지 말 것 - 대부분의 AI 이미지 모델은 한글을 제대로 못 그립니다. 자막은 따로 입히세요

2. 한 번에 다 하려고 하지 말 것 - 스크립트 먼저, 이미지 확인, 그다음 영상 순서로 단계별로 진행하는 게 수정하기 편합니다

## 🌍 다른 업무에 적용한다면?

- 제품 소개 시리즈: "이 제품이 뭔데? → 이렇게 쓴다 → 이런 효과가 있다" 구조로 제품 숏폼 시리즈

- 뉴스레터 영상화: 텍스트 콘텐츠를 AI 캐릭터가 설명하는 숏폼으로 변환

- 사내 교육 자료: 보안 교육, 신입 온보딩 등 반복적으로 필요한 교육 영상 자동 생성

## 🚀 앞으로의 계획

현재 음성은 Google TTS를 사용하는데, 좀 기계적인 느낌이 있습니다. ElevenLabs 같은 고품질 TTS로 교체해서 더 자연스러운 나레이션을 만들 예정입니다.

config.json에 이미 10개의 주제 풀이 정의되어 있어서, 같은 방식으로 다른 시리즈도 빠르게 만들어볼 생각입니다.

## 📋 재사용 가능한 프롬프트

### 프롬프트 1: 숏폼 프로젝트 초기 세팅

> [프로젝트명] 폴더에 숏폼 제작 스킬 파일들을 생성해줘. config.json (캐릭터 설정, 영상 규격), 스토리 설계 모듈, 스크립트 작성 모듈, 이미지 생성 모듈, 자막 오버레이 모듈을 만들어줘.

### 프롬프트 2: 시리즈 콘텐츠 생성

> "[주제]"를 3부작 시리즈로 만들어줘. 1부는 문제 인식, 2부는 실제 사례, 3부는 해결책 구조로. 각 에피소드는 5개 씬으로 구성하고, 씬마다 나레이션과 이미지 프롬프트를 생성해줘.

### 프롬프트 3: 한글 깨짐 방지 이미지 프롬프트

> 이미지 프롬프트에서 모든 텍스트와 한글 문자를 제외해줘. 자막은 이미지 생성 후 별도로 오버레이할 거야. 프롬프트 끝에 "Do not include any text, speech bubbles, or Korean characters in the image."를 추가해줘.

episode_01_final.mp4
2.59MB

episode_02_final.mp4
3.77MB

episode_03_final.mp4
2.82MB

1
3개의 답글

뉴스레터 무료 구독

👉 이 게시글도 읽어보세요