소개
최근에 ChatGPT와 여러 AI 도구들을 이용해서 스토리 기반 유튜브 숏츠 영상을 직접 만들어보는 실험을 했어요. 단순한 이미지 생성이나 대본 생성이 아니라, 전체 영상 흐름이 일관되게 이어지는 콘텐츠를 만들 수 있을지 궁금했거든요. 특히 GPT의 이미지 생성 능력과 음성 합성 도구까지 활용해서 얼마나 자연스러운 결과가 나오는지 확인해보고 싶었어요.
진행 방법
이번 실험에서 사용한 도구들은 아래와 같아요:
GPT에 대본의 틀을 잡은 뒤 내용을 던져주고 수정 보완해 주기 -> 장면 분할 요청하기.
ChatGPT 탐색 -> '일관성'키워드로 검색 후 이미지 일관성 gpts 찾기
"너는 지금부터 디즈니/픽사 스타일의 3D 이미지 전문가야. 다음 내용의 이미지를 제작해줘."
영상의 스토리 구성 및 대본 작성/수정에 활용
영어 대본도 작성했지만 정확도는 따로 검토하지 못했어요
이미지 생성 (GPT 내부 도구 사용):
각 장면에 맞는 이미지 생성
가능한 한 스토리 흐름에 맞춰 일관성 있게 제작
Grock:
생성된 이미지들을 영상화해주는 도구
장면을 연결해서 숏츠 스타일 영상으로 변환
분할해서 만든 이미지로 대본 내용과 함께 프롬프트로 던져서 각 장면 제작.
ElevenLabs:
영어 대본을 자연스러운 목소리로 음성 합성
영상에 음성 내레이션으로 삽입
캡컷(CapCut):
최종 영상 편집 및 자막, 효과 추가
결과와 배운 점
Lian was a famous astronomer living in a small mountain observatory.
리안은 산속 작은 천문 관측소에서 살아가는 유명한 천문학자였어요.
People praised him, and every night scholars gathered to enjoy star-watching parties celebrating his success.
사람들은 그를 칭찬했고, 매일 밤 학자들이 모여 그의 성공을 축하하며 별 관측 파티를 즐겼죠.
His life looked perfect.
리안의 삶은 완벽해 보였어요.
But one day, his main equipment failed, and his big research presentation fell apart.