1. 소개
지난번에는 구글 Flow 에이전트를 활용해 《가정경영자》 영상을 만들었던 후기를 전해드렸었는데요. 이번에는 한 단계 더 나아가, 대화형 음성을 넣은 《자기경영 - 시간 관리편》 영상을 만든 사례를 만들어 보았습니다.
영상 주제: "긴급하지는 않지만 중요한 일을 먼저하라(시간 관리)"
포맷: 지혜로운 60대 시니어 멘토와 고민 많은 30대 청년의 2인 대화형 애니메이션
최종 분량: 2분 10초
2. 사용된 AI 및 편집 도구 (5가지 에이전트 조합)
Gemini: 전체 16개 컷의 스토리라인 기획 및 주인공 이미지 컷 제작, 인물별 대사 텍스트 정밀 조율 및 16개 컷의 설명문 작성
슈퍼톤 플레이 (Supertone Play): 캐릭터 A(60대 멘토의 신뢰감 있는 목소리)와 캐릭터 B(30대 청년의 고민이 묻어나는 목소리)의 생동감 있는 오디오 생성
구글 Flow: 두 캐릭터의 이미지와 프롬프트 설명을 에어전트에 입력하여, 비주얼 일관성을 유지한 수채화 및 웹툰 스타일(Watercolor & Webtoon style)의 이미지 및 비디오 생성
Grok: Flow에서 만든 정지 이미지에 자연스러운 무빙과 생동감을 불어넣는 비디오 변환
캡컷 (CapCut): 영상 조각 편집, 부족한 분량 추가 조율, 자막 생성, 배경음악(BGM) 볼륨 믹싱 및 최종 렌더링
3. 단계별 제작 프로세스 및 진솔한 노하우
Step 1: 스토리 및 대본 정교화 (Gemini)
제 책 <자기경영자> 내용중 시간 관리의 핵심 메시지인 "급하진 않지만 중요한 것(큰 돌)을 먼저 채우라"는 주제의 글을 바탕으로, 시각적 연출이 가능하도록 Gemini와 함께 대본(전체 16개 컷의 스토리라인 기획)을 다듬었습니다.(2분 분량)
60대 멘토와 30대 청년의 대화 형태로 만들었고, 두명의 이미지의 캐릭터를 생성했습니다.
처음에는 실사 형태의 이미지를 만들어 주었으나 일관성 문제가 우려되었습니다. 그래서 4개 스타일을 제안해 달라고 했고, 4개 스타일 중에서 "감성 웹툰/수채화 스타일로 결정했습니다.
2분 분량으로 16개 이미지 컷을 만들 수 있도 록 각 이미지 컷의 설명서를 만들어 달라고 했습니다.
Step 2: 입체적인 2인 대화 음성 생성 (슈퍼톤 플레이)
60대 멘토와 30대 청년의 목소리를 개성 있게 생성했습니다.
잘 어울리는 음성을 찾아 2명 각각의 대사를 녹음했습니다.
Step 3: 캐릭터 에이전트로 일관성 잡기 (구글 Flow)
컷마다 인물의 비주얼이 바뀌는 문제를 막기 위해, 구글 Flow에서 '캐릭터' 기능을 이용하여 2명의 캐릭터를 만들었습니다.(정면만이 아니라 옆면, 뒷면 이미지까지)
Flow 에이전트 지침에 캐릭터 이미지와 구체적인 설명을 미리 주입했습니다. 덕분에 은발 시니어와 청년의 수채화 톤이 끝까지 일정하게 유지되었습니다.
Step 4: 유료화 장벽 극복과 Grok의 활용 (시행착오와 돌파)
입모양을 맞추어 비디오를 생성해주는 립싱크 비디오 AI 'Hedra'와 'D-ID'가 있다고 시도해 보았습니다. 영상 1개를 만들자마자 유료 전환 창이 떠서 과감히 포기했습니다.
사실 립싱크 비디오 AI 'Hedra'로 작업을 하니 립싱크는 확실히 잘 되는 것을 확인했습니다.
대신 구글 Flow와 Grok의 조합으로 선회하여 영상에 은은한 생동감을 주는 방식을 택했습니다. 입모양이 약간 맞지 않는 문제가 있었습니다.
Step 5: 종합 편집 및 사운드 디자인 (캡컷)
오디오와 비디오를 넣어 음성에 맞추어 비디오 길이를 조절하여 편집을 진행했습니다.
캡컷의 자동 자막 생성 및 수정 기능을 활용하였습니다.
[돌발 상황 해결] 먼저 만든 슈퍼톤 오디오의 길이가 긴 구간이 있어, 준비한 영상 분량이 모자라는 일이 생겼습니다. 캡컷 타임라인에 맞춰 구글 Flow와 Grok으로 이미지와 영상을 추가 생성해 레이어를 추가로 채워 넣었습니다.
오디오 믹싱: 자막(자동 캡션)을 정렬하고, 잔잔한 시네마틱 피아노 음악을 깔았습니다. 대사가 묻히지 않도록 BGM 볼륨을 -20dB 이하로 대폭 낮췄습니다.
마무리 여운: 엔딩 타이틀 컷에서 음악이 부드럽게 사라지도록 페이드 아웃(Fade out) 3초를 적용해 깊은 인상을 남겼습니다.
Step 6: 영상을 제 유튜브 채널에 업로드했습니다.
https://www.youtube.com/watch?v=lFYF-Yxk-eA
4. 결과와 배운 점
(1) 결과
여러 AI와 Tool을 활용하여 2분 10초 분량의 《자기경영 - 시간 관리편》 애니메이션 영상을 최종 완성하였습니다.
장시간에 걸친 작업이었지만 음성을 넣은 첫 작품이기에 나름 만족하고 있습니다.
(2) 배운 점
이번 영상을 제작하며 스터디장님께서 전수해주신 소중한 팁들을 복습하고 실전에 적용해보았습 니다. 일부 기능은 완벽히 마스터하여 실행했고, 일부 고급 기능은 다음 프로젝트의 과제로 남겨두게 되었습니다.
성공적으로 실행하고 따라한 점:
캡컷 편집 기능 최적화: 오디오 음파를 정밀하게 조절하기 위해 '넓고 높게 보는 UI'를 적극 활용했고, '자동 자막 생성 및 수정' 기능으로 싱크를 빠르게 맞췄습니다.
AI 음성 일관성 확보: 슈퍼톤 플레이를 활용해 60대 멘토와 30대 청년의 개성 있는 목소리를 만들고 구어체 대사를 매끄럽게 연출했습니다.
오디오 안전 믹싱: 대사와 배경음악이 섞일 때 목소리가 묻히지 않도록 오디오 볼륨을 최적화했습니다.
아쉽게 실행하지 못해 향후 과제로 남긴 점:
립싱크 기술 : 일부 AI 도구들의 갑작스러운 유료화 장벽으로 인해 실제 영상에 립싱크를 완벽히 매칭하는 단계까지는 실행하지 못했습니다.
기타 AI 도구 비교: 타입캐스트 등 스터디에서 배운 다양한 AI 음성 도구들을 교차 비교하며 캐릭터 음성의 일관성을 더 세밀하게 확보하는 방안은 다음 프로젝트에서 심화 학습으로 도전해볼 계획입니다.
캡컷 프리렌더링: 이번에는 수동으로 기민하게 대응했으나, 향후 이펙트가 많아질 때를 대비해 프리렌더링 기능을 다루는 연습이 더 필요함을 느꼈습니다.
5. 도움 받은 글 (옵션)
이번 스터디장님과 스터디원분들의 열정적이고 꾸준한 실행력에 감동을 받았습니다.
스터디장님과 스터디원분들이 카 톡방을 통해 공유해 주신 각종 사례나 프롬프트 등이 많은 도움이 되었습니다.
스터디장님과 스터디원분들의 열정에 감동하여 저도 최선을 다하게 되었습니다.
감사합니다.