음성이 들어간 "자기경영 - 시간 관리편" 영상 만들기

1. 소개

  • 지난번에는 구글 Flow 에이전트를 활용해 《가정경영자》 영상을 만들었던 후기를 전해드렸었는데요. 이번에는 한 단계 더 나아가, 대화형 음성을 넣은 《자기경영 - 시간 관리편》 영상을 만든 사례를 만들어 보았습니다.

  • 영상 주제: "긴급하지는 않지만 중요한 일을 먼저하라(시간 관리)"

  • 포맷: 지혜로운 60대 시니어 멘토와 고민 많은 30대 청년의 2인 대화형 애니메이션

  • 최종 분량: 2분 10초

2. 사용된 AI 및 편집 도구 (5가지 에이전트 조합)

  • Gemini: 전체 16개 컷의 스토리라인 기획 및 주인공 이미지 컷 제작, 인물별 대사 텍스트 정밀 조율 및 16개 컷의 설명문 작성

  • 슈퍼톤 플레이 (Supertone Play): 캐릭터 A(60대 멘토의 신뢰감 있는 목소리)와 캐릭터 B(30대 청년의 고민이 묻어나는 목소리)의 생동감 있는 오디오 생성

  • 구글 Flow: 두 캐릭터의 이미지와 프롬프트 설명을 에어전트에 입력하여, 비주얼 일관성을 유지한 수채화 및 웹툰 스타일(Watercolor & Webtoon style)의 이미지 및 비디오 생성

  • Grok: Flow에서 만든 정지 이미지에 자연스러운 무빙과 생동감을 불어넣는 비디오 변환

  • 캡컷 (CapCut): 영상 조각 편집, 부족한 분량 추가 조율, 자막 생성, 배경음악(BGM) 볼륨 믹싱 및 최종 렌더링

3. 단계별 제작 프로세스 및 진솔한 노하우

Step 1: 스토리 및 대본 정교화 (Gemini)

  • 제 책 <자기경영자> 내용중 시간 관리의 핵심 메시지인 "급하진 않지만 중요한 것(큰 돌)을 먼저 채우라"는 주제의 글을 바탕으로, 시각적 연출이 가능하도록 Gemini와 함께 대본(전체 16개 컷의 스토리라인 기획)을 다듬었습니다.(2분 분량)

  • 60대 멘토와 30대 청년의 대화 형태로 만들었고, 두명의 이미지의 캐릭터를 생성했습니다.

  • 처음에는 실사 형태의 이미지를 만들어 주었으나 일관성 문제가 우려되었습니다. 그래서 4개 스타일을 제안해 달라고 했고, 4개 스타일 중에서 "감성 웹툰/수채화 스타일로 결정했습니다.

    나이든 남자와 젊은 남자의 사진 두 장
모자와 책을 쓴 남자의 만화
다양한 표정을 지닌 남자의 일련의 사진
  • 2분 분량으로 16개 이미지 컷을 만들 수 있도록 각 이미지 컷의 설명서를 만들어 달라고 했습니다.

    한국어 한국어 한국어 한국어 한국어 한국어 한국어 한국어

Step 2: 입체적인 2인 대화 음성 생성 (슈퍼톤 플레이)

  • 60대 멘토와 30대 청년의 목소리를 개성 있게 생성했습니다.

  • 잘 어울리는 음성을 찾아 2명 각각의 대사를 녹음했습니다.

    화면에 한국어가 표시됩니다

Step 3: 캐릭터 에이전트로 일관성 잡기 (구글 Flow)

  • 컷마다 인물의 비주얼이 바뀌는 문제를 막기 위해, 구글 Flow에서 '캐릭터' 기능을 이용하여 2명의 캐릭터를 만들었습니다.(정면만이 아니라 옆면, 뒷면 이미지까지)

  • Flow 에이전트 지침에 캐릭터 이미지와 구체적인 설명을 미리 주입했습니다. 덕분에 은발 시니어와 청년의 수채화 톤이 끝까지 일정하게 유지되었습니다.

    많은 사진이 포함된 웹페이지의 스크린샷

Step 4: 유료화 장벽 극복과 Grok의 활용 (시행착오와 돌파)

  • 입모양을 맞추어 비디오를 생성해주는 립싱크 비디오 AI 'Hedra'와 'D-ID'가 있다고 시도해 보았습니다. 영상 1개를 만들자마자 유료 전환 창이 떠서 과감히 포기했습니다.

  • 사실 립싱크 비디오 AI 'Hedra'로 작업을 하니 립싱크는 확실히 잘 되는 것을 확인했습니다.

    한국어 문자가 표시된 웹 브라우저의 스크린샷
  • 대신 구글 Flow와 Grok의 조합으로 선회하여 영상에 은은한 생동감을 주는 방식을 택했습니다. 입모양이 약간 맞지 않는 문제가 있었습니다.

    한국 비디오 사이트의 스크린샷

Step 5: 종합 편집 및 사운드 디자인 (캡컷)

  • 오디오와 비디오를 넣어 음성에 맞추어 비디오 길이를 조절하여 편집을 진행했습니다.

  • 캡컷의 자동 자막 생성 및 수정 기능을 활용하였습니다.

  • [돌발 상황 해결] 먼저 만든 슈퍼톤 오디오의 길이가 긴 구간이 있어, 준비한 영상 분량이 모자라는 일이 생겼습니다. 캡컷 타임라인에 맞춰 구글 Flow와 Grok으로 이미지와 영상을 추가 생성해 레이어를 추가로 채워 넣었습니다.

  • 오디오 믹싱: 자막(자동 캡션)을 정렬하고, 잔잔한 시네마틱 피아노 음악을 깔았습니다. 대사가 묻히지 않도록 BGM 볼륨을 -20dB 이하로 대폭 낮췄습니다.

  • 마무리 여운: 엔딩 타이틀 컷에서 음악이 부드럽게 사라지도록 페이드 아웃(Fade out) 3초를 적용해 깊은 인상을 남겼습니다.

    비디오 편집 소프트웨어의 스크린샷

Step 6: 영상을 제 유튜브 채널에 업로드했습니다.
https://www.youtube.com/watch?v=lFYF-Yxk-eA

4. 결과와 배운 점

(1) 결과

  • 여러 AI와 Tool을 활용하여 2분 10초 분량의 《자기경영 - 시간 관리편》 애니메이션 영상을 최종 완성하였습니다.

  • 장시간에 걸친 작업이었지만 음성을 넣은 첫 작품이기에 나름 만족하고 있습니다.

(2) 배운 점

  • 이번 영상을 제작하며 스터디장님께서 전수해주신 소중한 팁들을 복습하고 실전에 적용해보았습니다. 일부 기능은 완벽히 마스터하여 실행했고, 일부 고급 기능은 다음 프로젝트의 과제로 남겨두게 되었습니다.

  • 성공적으로 실행하고 따라한 점:

    • 캡컷 편집 기능 최적화: 오디오 음파를 정밀하게 조절하기 위해 '넓고 높게 보는 UI'를 적극 활용했고, '자동 자막 생성 및 수정' 기능으로 싱크를 빠르게 맞췄습니다.

    • AI 음성 일관성 확보: 슈퍼톤 플레이를 활용해 60대 멘토와 30대 청년의 개성 있는 목소리를 만들고 구어체 대사를 매끄럽게 연출했습니다.

    • 오디오 안전 믹싱: 대사와 배경음악이 섞일 때 목소리가 묻히지 않도록 오디오 볼륨을 최적화했습니다.

  • 아쉽게 실행하지 못해 향후 과제로 남긴 점:

    • 립싱크 기술 : 일부 AI 도구들의 갑작스러운 유료화 장벽으로 인해 실제 영상에 립싱크를 완벽히 매칭하는 단계까지는 실행하지 못했습니다.

    • 기타 AI 도구 비교: 타입캐스트 등 스터디에서 배운 다양한 AI 음성 도구들을 교차 비교하며 캐릭터 음성의 일관성을 더 세밀하게 확보하는 방안은 다음 프로젝트에서 심화 학습으로 도전해볼 계획입니다.

    • 캡컷 프리렌더링: 이번에는 수동으로 기민하게 대응했으나, 향후 이펙트가 많아질 때를 대비해 프리렌더링 기능을 다루는 연습이 더 필요함을 느꼈습니다.

5. 도움 받은 글 (옵션)

  • 이번 스터디장님과 스터디원분들의 열정적이고 꾸준한 실행력에 감동을 받았습니다.

  • 스터디장님과 스터디원분들이 카톡방을 통해 공유해 주신 각종 사례나 프롬프트 등이 많은 도움이 되었습니다.

  • 스터디장님과 스터디원분들의 열정에 감동하여 저도 최선을 다하게 되었습니다.
    감사합니다.

1
1개의 답글

뉴스레터 무료 구독