AI 교육 영상 제작 사례

소개

시도하고자 했던 것과 그 이유를 알려주세요.

회사에서 교육 영상을 제작하기 위해 AI 영상 파이프라인 구축 공부를 시작했습니다. 이번 스터디의 핵심인 강사님이 세팅해 둔 안티그래비티(Anti-gravity) 에이전트를 활용해 영상 제작을 자동화하는 실습을 꼭 해보고 싶었으나, 회사 컴퓨터의 보안 이슈로 인해 프로그램 설치가 불가능하여 아쉽게도 해당 파이프라인 실습은 진행하지 못했습니다. 하지만 완벽한 결과물보다는 시행착오를 겪으며 경험을 공유하는 것이 스터디의 목표인 만큼, 현재 제가 접근할 수 있는 다른 AI 툴들을 조합하여 교육용 영상의 프로토타입을 제작하는 데 도전했습니다.
오는 4월에 개인 노트북을 구매한 후에는 본격적으로 안티그래비티를 세팅해 볼 예정입니다!

진행 방법

어떤 도구를 사용했고, 어떻게 활용하셨나요?

안티그래비티를 당장 쓸 수 없는 환경이었기에, 나노바나나(Nanobana)와 Kling AI, 제미나이(Gemini), 그리고 캡컷(CapCut)을 조합하여 반자동화 방식으로 작업했습니다.
1. 시나리오 및 프롬프트 기획 (Gemini): 구글 제미나이를 통해 교육 영상의 시나리오를 기획하고, 이미지 생성을 위한 영문 프롬프트를 도출했습니다.
2. 이미지 생성 (Nanobana): 제미나이가 써준 프롬프트를 바탕으로 나노바나나를 활용해 교육 영상에 들어갈 초기 캐릭터와 배경 이미지를 생성했습니다.
3. 영상 생성 (Kling AI): 생성된 이미지를 Kling AI에 넣어 영상으로 변환했습니다.
4. 후보정 및 편집 (CapCut): AI가 만든 영상 소스들을 캡컷으로 가져와 자막, 텍스트, 음향을 입혀 최종 보완 작업을 진행했습니다.

Tip: 사용한 프롬프트 전문을 꼭 포함하고, 내용을 짧게 소개해 주세요.

Cinematic wide drone shot hovering over a massive, desolate industrial factory complex. Heavy rolling fog covers the ground. Monochromatic black and white, high contrast. Eerie stillness. Slow and extremely smooth forward tracking motion. 8k resolution, photorealistic, gloomy atmosphere.
Camera slowly glides through thick fog and giant steel pillars inside a dark industrial factory. Black and white photography. Hyper-detailed textures of cold, heavy metal. Volumetric light rays piercing through the mist. Smooth cinematic push-in. Tense and mysterious mood, ultra-realistic, 8k.

Low angle shot of a colossal, dark, heavy machinery structure looming in the shadows deep inside a factory. Extreme macro details of interlocking steel parts. Black and white, dramatic cinematic lighting. Slow, creeping zoom-in towards the center of the machine. Intimidating and oppressive mood, photorealistic.

Tip: 활용 이미지나 캡처 화면을 꼭 남겨주세요.

[보안상 이미지 업로드가 어렵습니다.]

Tip: 코드 전문은 코드블록에 감싸서 작성해주세요. ( / 을 눌러 '코드 블록'을 선택)

(내용 입력)

결과와 배운 점

배운 점과 나만의 꿀팁을 알려주세요.

과정 중에 어떤 시행착오를 겪었나요?

도움이 필요한 부분이 있나요?

앞으로의 계획이 있다면 들려주세요.

영상 길이 조절로 부자연스러움: 처음에 한 번에 10초짜리 롱테이크 영상을 만들려고 하니 중간에 움직임이 부자연스러워지거나 의도치 않은 방향으로 흘러가는 문제가 발생했습니다. 이를 해결하기 위해 Kling AI의 '커스텀 멀티샷(Custom Multi-shot)' 기능을 활용하여 영상을 3초에서 5초 단위로 짧게 끊어서 생성한 뒤 이어붙이는 방식을 사용하니 훨씬 안정적인 결과물이 나왔습니다.

텍스트 깨짐 : AI 비디오 툴(Kling)의 특성상 영상 안에 글자를 넣으면 심하게 깨지는 현상이 있었습니다. 그래서 AI 렌더링 단계에서는 최대한 화면 내의 텍스트를 없애고, 캡컷(CapCut) 편집기를 통해 자막, 설명 글자, 음향을 추가하는 방식으로 퀄리티를 보완했습니다.

앞으로 제가 주력해야 할 부분은 교육 영상 특성상 '동일한 캐릭터(사람)'가 화면에 지속적으로 등장하며 이어지는 작업입니다. AI 에이전트에 캐릭터 일관성 유지를 위해 다각도 표정이 담긴 '캐릭터 시트(티포즈 등)'를 만들거나 레퍼런스 이미지를 활용하는 방법들이 있는 것 같습니다.

동일한 인물이 긴 호흡의 교육 영상에서 일관성 있게 말하고 행동하게 하려면 어떤 파이프라인이나 프롬프트 지침을 세팅하는 것이 가장 효율적일지, 고수님들의 조언과 노하우를 배우고 싶습니다!

도움 받은 글 (옵션)

참고한 지피터스 글이나 외부 사례를 알려주세요.

(내용 입력)

2개의 답글

뉴스레터 무료 구독

👉 이 게시글도 읽어보세요