이미지 / 음악 / 영상

  • 박수비타민 — 체조 AI 영상 Kling 모션 클론 활용기

    ## 소개 지난 주 스터디에서 힌트를 얻은 Kling 모션 클론을 사용해봐야 해서 동작이 가장 간단한 영상을 제작해봤습니다. 건강박수는 누가 언제부터 했는지 모르겠지만, 노인 체조 중 레전드 스테디 체조입니다. 그런데 효능과 박수를 설명하면서 박수만 치는 영상들이 다 지루합니다. 그래서 박수와 효능을 가사로 하는 신나는 노래로 건강박수 영상 ‘박수 비타민’을 제작했습니다. ## 완성 영상 https://youtu.be/mO7R6O8C8Sw?si=eXF1Pjr5oRrHyani ## 사용 툴 - 기획·문서화: Claude Code - 노래: 수노 - 이미지 생성: 나노바나나2 - 영상 클립 분리: LosslessCut (https://github.com/mifi/lossless-cut/releases) - 모션 클론: 힉스필드 Kling (모션 클론) - 편집: CapCut ## 진행 방법 1) 캐릭터와 씬 이미지 기존의 나훈훈 캐릭터를 그대로 사용하는데, 캐릭터를 레퍼런스로 넣고 배경 이미지를 생성하려고 하니, 인물 일관성도 걱정되지만, 제일 우려된 건 인물 크기와 구도였습니다. 팝아트 스타일의 풍경을 하려고 했더니, 인물까지 팝아트 스타일로 바뀌기도 했구요. 그래서 배경 이미지만 생성하고, 캡컷에서 합성해서 스틸 컷으로 씬 이미지를 준비했습니다. 박수 준비 동작이 다 동일하니, 좀 수월했습니다. 2) 동작 촬영 원본 동작 영상을 제가 직접 촬영했습니다. 힉스필드에서 Kling 모션 클론 기능으로 촬영 영상의 동작을 나훈훈 캐릭터에 적용하려구요. 대충 찍었지만 그래도 영상에서 인물 사이즈와 구도는 유지했습니다. 찍는 것은 귀찮지만, ai 영상 생성에 자주 시행착오하거나 크래딧을 날리는 것보다는 낫습니다. 3) 영상 클립 분리 — LosslessCut** 촬영 영상을 모션 클론에 넣기 위해서 쪼개야 하는데, 클로드코드가 LosslessCut을 알려줬습니다. CapCut으로 하면, 각 클립마다 렌더링해야하는 것 같아서.. LosslessCut은 UI 화면이 좀 작긴 하지만, 구간을 모두 마킹한 뒤 한 번에 내보낼 수 있고, 무료라서 꽤 쓸만합니다. LosslessCut 다운로드: https://github.com/mifi/lossless-cut/releases 4) 힉스필드에서 Kling 모션 클론 "Add motion to copy"로 촬영 영상(3~30초)을 올리고, "Add your character"로 캐릭터 이미지를 올립니다. 모델은 Kling 3.0 Motion Control, 품질은 720p, 6~9초 정도 1회 생성에 6~9크레딧이 소요됩니다. - Scene control mode 이걸 켜면 배경 소스를 캐릭터 이미지 또는 모션 영상에서 선택할 수 있습니다. Image 탭을 선택하면 캐릭터 이미지의 배경이 그대로 영상 배경으로 사용된다는 겁니다. 저는 배경이 합성된 캐릭터이미지를 유지해야 하니까요. 그런데, 레퍼런스 캐릭터처럼 상반신 구도를 유지하지 않고, 자꾸 우스꽝스럽게 하체를 새로 생성하네요. - Orientation Scene control mode를 끄고 Orientation 기능을 테스트해봤습니다. Orientation에서도 video와 image를 선택할 수 있는데, 결과적으로 이 기능이 image의 캐릭터와 배경을 유지해줬습니다. Orientation Image 버튼이 비활성화 되는 문제가 있어서 여러가지 테스트 해보니 모션 영상 소스 클립이 길 때 그런 것 같습니다. 그러더라도 프롬프트에 구도와 배경을 한 번 더 작성했던 것 같습니다. - 생성 영상 길이 박수가 동일한 동작이 반복적이고, 크래딧이 아까워서 짧은 영상을 생성해서 반복 사용하면 된다고 생각했는데, 다소 미련했습니다. 영상 클립 재활용은 타이밍 편집이 역시 어려웠습니다. 다시 하면 동작을 조금 더 길게 생성할 것 같아요. - 일관성 그래도 유지되는 편인데, 이미지보다 어딘지 모르게, 영상 인물인 저와 닮아지는 느낌이 있습니다. 인물 분위기나 동작이 조금 더 여성스러워지기도 하고요. 다음 촬영때는 참고해야겠습니다. 5) CapCut 편집 모션 클론 클립을 짧게 생성했더니 박수 동작이 반복될 때 클립을 여러 번 붙여야 했습니다. 끊김 없이 자연스럽게 이어지는 것은 역시 잘 안됩니다. 아무래도 동작이라서 리버스도 어색합니다. 영상을 좀 더 길게 생성했어야 했는데, 크래딧 아끼다가 노가다가 늘었네요. - CapCut 편집 효과 이번에 토옵짱님이 공유해주신 CapCut 효과 영상을 참고해서 편집 효과를 활용해봤습니다. 이번 영상이 배경이 정적인데, 훨씬 생기 있어 졌습니다. 캡컷을 유료로 쓰는 동안에 효과를 많이 써봐야겠습니다. ## 자동화 적용 가능성 작업 후에 자동화 가능한 부분을 확인해보니, 힉스필드 Claude Code CLI 연동이 있네요. 이미지, 영상생성은 되는데 모션 클론은 안됩니다. 이번 작업처럼 씬과 동작이 비슷한 패턴일 때는 사용해보려고 합니다.
    1
    1
  • 쿼카의 상상 속 주말🐨 숏폼 제작기 2탄! (더 생동감 넘치는 영상 구현하기)

    지난번 1탄에서는 '행복한 다이어터 쿼카'의 다이어트 합리화와 코믹한 엔딩을 담은 숏폼을 제작했었는데, 음성 부분과 BGM이 아쉬웠습니다. 이번에는 그 목표를 달성하기 위해 지난번 아쉬웠던 점을 보완하여 캐릭터에 실제 생동감 넘치는 음성을 입혀 2번째 영상을 제작해 보았습니다. 진행 방법 이번 영상 제작에는 지난번 사용했던 툴을 고도화하고, 음성 삽입을 위한 새로운 AI 도구를 추가로 활용했습니다. 기존처럼 시나리오와 프롬프트 제작은 안티그래비티를 활용했고 프롬프트를 이용해 제미나이와 영상을 먼저 구현했습니다. 하지만 여전히 원하는 싱크와 음성이 나오지 않아 기존 음성을 지우고 Hedra을 통해 음성을 삽입했습니다. 이번 프로젝트의 핵심인 음성 구현을 위해 AI 음성 도구로 쿼카 특유의 깜찍하고 억울한 목소리를 톤앤매너에 맞춰 생성했습니다. 이 오디오 파일과 영상을 Hedra에 넣어 자연스럽게 말하며 움직이는 쿼카 영상을 완성했습니다. 결과와 배운 점 오디오의 중요성: 확실히 지난번 정적인 영상보다 AI voice를 통해 목소리가 들어가니 캐릭터의 생동감이 200% 살아나는 것을 느꼈습니다. 캐릭터의 성격에 맞는 목소리 톤을 고르는 것이 숏폼의 몰입도를 좌우한다는 것을 배웠습니다. 나만의 꿀팁: Hedra에서 오디오와 이미지를 합성할 때, 이미지 속 캐릭터의 정면 응시 비율이 높을수록 립싱크가 훨씬 자연스럽게 출력되는 것 같습니다. 다음번에는 다른 이야기의 숏폼을 만들어 캐릭터를 더 다양한 이미지로 구현해 보고 싶습니다. 가능하다면 2~3분 분량의 미니 웹 애니메이션 시리즈 레이아웃을 잡아 스토리텔링 요소를 추가해 장기 콘텐츠로 발전시켜 보고 싶습니다
    1
    1
  • 디즈니 예고편 st 애니메이션 만들기 (아직 갈 길이 먼..)

    디즈니 스타일 애니메이션 도전 픽사 디즈니 예고편 스타일의 애니메이션 영상을 만들고 싶어서 도전하게 되었다. 사내연애 커플의 스토리로 기획 방향을 잡고, 시나리오를 작성했다. 애니메이션 제작 과정 영상을 제작하는 데에 사용한 도구는 다음과 같다. 여러 도구를 사용하면서 결과물을 비교해보고, 최종적으로 각자 잘하는 것을 맡기게 되었다. - GPT : 실제 사진을 첨부하여 '디즈니 스타일 이미지' 생성 - 클로드 : 만들고 싶은 장면의 나레이션과 시나리오를 넣어 '영상 프롬프트' 생성 - Flow : GPT로 뽑은 이미지와 클로드로 뽑은 프롬프트를 넣고 애니메이션 영상 생성 GPT나 flow에 원하는 장면의 참고 사진을 넣고, 디즈니 스타일의 이미지를 만든다. 클로드에서 만들고 싶은 장면을 설명하여 '영상 프롬프트' 생성 (보통 뽑아준 그대로 사용하지는 않고, 조금씩 입맛에 맞게 변형하여 사용하고 있다) Flow에서 GPT로 만든 이미지와 클로드로 만든 프롬프트를 넣고 영상을 생성한다. 위 과정을 반복하면서 장면별 영상을 생성한다. 주인공 캐릭터들의 얼굴을 유지하는 게 쉽지는 않지만, Flow에서는 캐릭터를 저장하는 기능이 있어 해당 기능을 사용하면 비교적 비슷한 그림체를 유지할 수 있다! (물결님에게 배운 Tip) 시행착오와 팁 삽질을 거쳐 발견한 나만의 소소한 TIP 🪏 위 개발새발 그림처럼 사무실 구도를 잡고 싶었는데, 아무리 말로 설명해도 Flow 저 구도를 안뽑아줬다. 진짜 거의 10번 정도 시도한 것 같다 (내 크레딧 ㅠㅠ) 아무리 디테일하게 설명해도 계속 이렇게 떨어뜨려 놓고 책상 각도도 원하는 구도로 나오지 않았다. 그래서 마지막 방법으로 원하는 이미지를 먼저 만들고 (장면 이미지, 캐릭터 첨부하여 디즈니 스타일로 생성) Flow에 이 이미지를 첨부한 후, 아래처럼 디테일하게 프롬프트를 작성하니 원하는 구도의 영상이 만들어졌다. 그렇게 완성된 영상! (키보드 갑툭튀는 흐린 눈 하기로 결정 ..) 🪏 삽질 결론 : Flow에서 애니메이션 영상을 만든다면, 실제 장면이나 인물 사진을 넣는 대신 '애니메이션화 시킨 이미지'를 넣으면 이미지와 거의 유사하게 영상을 뽑는 것 같다. 결과와 배운 점 처음에는 한 장면을 만드는 데에 10번 이상 시도하기도 했다. 원하는 대로 잘 안나오기도 했고, 실제 장면과 똑같이 만들고 싶은 욕심이 크다보니 크레딧을 엄청 낭비했다. 그래도 그런 시도들 덕분에 차차 프롬프트 감이 잡혔고, 이제는 1-2번 만에 원하는 영상을 뽑는 것 같다. 아래는 Flow로 생성한 영상들! 틈틈이 영상을 만들고 있지만, 아직 갈 길이 멀다. 시나리오를 너무 길게 작성했는지 아직 만들어야 할 영상이 오조오억개 정도 남았다 .. 남은 장면들도 부지런히 뽑아서 연결하고 .. 나레이션 넣고 .. BGM 넣고 .. 언제 완성하지 ? 그래도 영상 만드는 동안에는 너무 너무 너무 재밌다 !!!!! 삽질하다가 원하는 영상이 뙇 나오면 희열과 도파민이 엄청나다 💥 조금 느리더라도 꾸준히 작업해서 꼭 영상을 완성해야지! (제발) 아 그리고 자정을 넘어 새벽이 되면, 지구 반대편 사람들이 일하는 시간이라 Flow에 과부하가 걸리는 걸까? 거의 파업한 것처럼 오류를 뱉어낸다 ㅠㅠ 실패 오류가 나거나 아예 뜬금없는 영상을 보여주기도 한다. 다른 팀원분도 새벽 시간에만 같은 증상이었다고 하는 걸 보니 나만의 오류는 아닌 것 같고 .. 이런 부분도 차차 개선되긴 하겠지만, 일단 지금의 Flow는 새벽보단 오후 시간대가 작업하기 좋은 듯!
    1
    1
  • 구글 플로우로 영상 만들기 " 중2 유나의 하루"

    소개 구글 플로우를 통해 스토리보드에서 제작한 "중2 유나의 하루"를 제작했다 진행 방법 안티그래버티에서 4*4 스토리보드를 제작하고 그에 따라 각 영상을 구글플로우로 제작 진행하였다. 리모션으로 npm run preview 기능을 통해 영상 편집을 진행하였다. 결과와 배운 점 구글 플로우를 이용하여 영상을 연결진행해봤는데 제작에 작동이 용이하였다. 도움 받은 글 (옵션)
    0
    0
  • Umji

    AI로 세계관부터 숏폼 영상까지 만들어본 후기

    소개 시도하고자 했던 것과 그 이유를 알려주세요. 지난 프로젝트에 이어서 완성도를 높여서 음성까지 넣은 파일을 제작하였습니다. 다시 소개하자면 ‘없는물건상점’ 이라는 AI 웹툰 형 숏폼 콘텐츠 제작입니다. 없는물건상점은 현실에는 없지만 누구나 한 번쯤 “이런 거 있으면 좋겠다”라고 생각해봤을 법한 상상 속 물건을 소개하는 가상 상점의 이야기 입니다. 이 프로젝트를 시작한 이유는 AI를 활용해 단순한 이미지나 영상 한 컷을 만드는 것에서 더 나아가, 캐릭터, 세계관, 제품 콘셉트, 숏폼 영상 구성까지 하나의 시리즈 콘텐츠로 만들 수 있는지 실험해보고 싶었습니다. 특히 요즘 숏폼 콘텐츠는 짧은 시간 안에 공감과 재미를 동시에 전달해야 하는데, “실제로는 없지만 있으면 좋을 물건”이라는 콘셉트가 현대인의 피로감, 불안, 귀찮음 같은 감정을 가볍고 재미있게 풀어내기에 적합하다고 생각했습니다. (그런데 막상 영상으로 만들고 보니 재미없었음;) 진행 방법 어떤 도구를 사용했고, 어떻게 활용하셨나요? chatgpt와 flow를 위주로 활용하였습니다. ChatGPT 콘텐츠 세계관 기획 캐릭터 설정 제품 아이디어 발굴 숏폼 영상 씬 구성 이미지/영상 생성용 프롬프트 작성 후반 TTS 대사 작성 나나 점장, 모모 알바 캐릭터 이미지 제작 가상의 제품 이미지 제작 유튜브 프로필 이미지, 배너 이미지 제작 flow 각 장면별 숏폼 영상 클립 제작 9:16 세로형 영상 구성 실사형 또는 웹툰형 분위기 테스트 Antigravity IDE 대시보드 서버와 프로젝트 폴더 연계 Python 기반 대시보드 실행 및 확인 장면별 영상 파일 관리 다운로드한 영상 파일을 프로젝트 폴더에 자동 이동 파일명 규칙에 맞춰 영상 파일 정리 최종 합본 영상을 final.mp4로 교체 터미널 명령어를 활용한 반복 작업 자동화 대시보드와 실제 파일 구조를 연결해 전체 제작 흐름 관리 결과와 배운 점 총 6개의 개별 씬(Scene)으로 쪼개어 만들었던 짧은 영상 조각들을 'Flow'라는 도구를 활용해 매끄럽게 이어 붙여, 최종적으로 하나의 완성된 숏폼 영상(final.mp4)을 성공적으로 도출했습니다! 처음 기획했던 '생각 끄는 리모컨'의 스토리라인(불면증 공감 → 아이템 등장 → 시연 및 기절)이 끊김 없이 한 호흡의 영상으로 잘 연결되어 지난 사례보다 완성도 있는 결과물이 나왔습니다. 배운 점과 나만의 꿀팁을 알려주세요. AI 에이전트를 단순한 챗봇이 아니라 '로컬 파일 관리자'로 활용하였습니다. 저는 영상을 다운로드 폴더에 받아두기만 하고, 채팅으로 "방금 받은 파일 씬 4로 옮겨줘"라고 지시하기만 하면 에이전트가 알아서 제자리에 쏙쏙 정리해 주었습니다. 이후 각 씬이 준비되었을 때, 무거운 편집 프로그램을 켜서 일일이 자르고 붙이는 대신 Flow를 활용해 순서대로 영상을 스티칭(이어 붙이기)하니 작업 속도가 빨라졌습니다. 각 단계를 쪼개서 작업하고 마지막에 자동화 툴로 합치는 이 '파이프라인' 방식으로 제작해 보았는데 좀 더 효율적이고 쉬운 방법이 필요할 것 같습니다. 과정 중에 어떤 시행착오를 겪었나요? 초반에 시스템 내부 스크립트(Remotion)를 통해 로컬에서 영상을 자동 합성하려고 시도했습니다. 하지만 Windows 환경의 권한 문제(PSSecurityException)로 터미널 명령어가 막히는 오류가 발생했습니다. 그래서 외부 도구인 Flow로 방향을 틀어 개별 씬들을 엮어낸 뒤 에이전트에게 final.mp4로 교체해 달라고 요청함으로써 문제를 해결할 수 있었습니다. 도움 받은 글 (옵션) 참고한 지피터스 글이나 외부 사례를 알려주세요. (내용 입력)
    1
    0
  • [Antigravity × Remotion] 인기 유튜브 숏폼 스타일 그대로! AI와 함께 텍스트만 바꿔 다음 영상 찍어내는 '마법의 템플릿' 제작기

    # [Antigravity × Remotion] 인기 유튜브 숏폼 스타일 그대로! AI와 함께 텍스트만 바꿔 다음 영상 찍어내는 '마법의 템플릿' 제작기 ## 📝 한줄 요약 마음에 드는 인기 유튜브 쇼츠 영상의 편집 스타일을 AI와 함께 단 20초 만에 완벽히 분석한 뒤, 이를 누구나 대사와 이미지만 바꾸면 5분 만에 완성도 높은 비디오로 찍어낼 수 있는 '재사용 카드형 프레임 템플릿'으로 Remotion에 구축했습니다. 매번 편집 툴에서 자막과 블러 효과를 잡던 번거로움을 완전히 해결하여 제작 시간을 1편당 3시간에서 단 5분으로 단축하고, 브랜드의 일관된 시각적 정체성을 완벽하게 확립했습니다. **바쁘시면 이것만 읽어도 돼요:** - **사용한 도구와 목표**: AI 코딩 비서 Antigravity와 리액트 기반 영상 합성 엔진 Remotion을 결합하여, 유튜브 쇼츠의 최신 트렌드 레이아웃을 고스란히 이식한 재사용 가능한 '카드형 비디오 프레임' 구축. - **과정 중 깨달은 점**: 영상의 시각적 완성도뿐만 아니라 비즈니스 스케일업을 위해서는 매번 일회성으로 영상을 편집하는 것이 아니라, 설정 데이터(JSON)와 템플릿을 완전히 분리해 '한 번 구축하면 평생 재활용하는 시스템'을 만드는 것이 핵심이라는 점을 깨달았습니다. - **핵심 해결 방법**: 유튜브 레퍼런스의 모서리가 둥근 중앙 카드, 배경 블러, 자막 테두리 두께 등의 상세 비율 스펙을 AI에게 의뢰해 추출하고, Remotion의 합성 코드를 고도화해 다크 테두리 블러 비율을 90%에서 94%까지 디테일하게 피드백 조정하며 최상의 가독성을 찾아냈습니다. - **특별히 인상적이었던 순간**: 다중 프로젝트 간에 자막이 엉키는 기술적 충돌을 리모션 조건부 가드 코드로 깔끔하게 제어하는 한편, AI 이미지 생성 시 구글 Imagen/Flow의 민감한 정책 위반 필터를 한글 텍스트 제거 및 간결한 영어 영문 우회 묘사로 2차에 걸쳐 안전하게 풀어내며 위기를 극복한 순간이었습니다. - **확장성/재사용성**: 완성된 '마법의 프레임'은 다른 커피 전문점이나 F&B 매장, 혹은 아예 다른 업종의 홍보 숏폼을 제작할 때도 별도의 편집 기술 없이 설정 파일의 이미지와 대사 텍스트만 덮어써 주면 5분 만에 브랜딩 비디오로 재탄생시킬 수 있습니다. - **배운 교훈**: AI를 이미지 생성이나 프로그래밍에 활용할 때 막히거나 오류가 발생하면 포기하지 말고, 문맥을 세분화하여 단계적으로 수정 요청을 하거나 우회 템플릿을 설계하는 구조적 협업이 가장 효과적이라는 점을 배웠습니다. --- ## 🎯 이런 분들께 도움돼요 - **인기 유튜브나 인스타 릴스 편집 스타일을** 내 영상에 그대로 가져와서 빠르고 트렌디하게 연출해보고 싶은 마케터 및 1인 크리에이터 - **매번 영상 만들 때마다** 편집기 자막 폰트 크기 조절, 배경 음악 삽입, 싱크 맞추기 등의 수작업 노가다에서 해방되고 싶으신 분들 - **통일감 있는 숏폼 시리즈를** 규칙적으로 양산하여 브랜드 채널의 시각적 신뢰도와 아이덴티티를 100% 견고하게 구축하고 싶으신 1인 창업가 --- ## 😫 문제 상황 (Before) 가상 카페 브랜드 '카페메이트'의 숏폼 브랜드 필름 1화를 멋지게 제작한 뒤, 2화, 3화 에피소드를 양산해 나가는 로드맵을 그리고 있었습니다. 하지만 영상의 종류나 배경이 달라질 때마다 매번 영상 편집 도구를 켜서 자막의 외곽선 두께를 다시 조정하고, 배경을 블러 처리하며, 중앙 정렬 카드의 크기를 수동으로 맞추는 작업은 막대한 시간 낭비였습니다. 자칫 디테일을 조금이라도 놓치면 채널에 올라가는 영상들의 톤앤매너가 미세하게 비틀어져 시각적 정체성을 해치기 십상이었습니다. 비개발자로서 매번 디자인 시스템을 다시 세팅하는 번거로움을 원천 차단하고, **"레퍼런스로 삼은 잘 만든 유튜브 쇼츠의 세련된 디자인 레이아웃(프레임)을 그대로 고정해 두고, 텍스트와 에셋만 바꿔 끼우면 10분 안에 완성되는 마법의 복제 프레임"**을 반드시 완성해야만 숏폼 대량 제작 파이프라인을 굴릴 수 있었습니다. --- ## 🛠️ 사용한 도구 - **AI 코딩 및 협업**: Google Antigravity (Advanced Agentic Coding Agent) - **비디오 합성 및 렌더링**: Remotion (React/TypeScript 기반 자동 영상 그래픽 렌더러) - **이미지 생성 AI**: Google Gemini (실사 웰메이드 그래픽 엔진) - **비디오 생성 AI**: Google Veo 3.1 (`veo_native_speech` 한국어 성우 모드 탑재) - **프로젝트 모니터링**: Vanilla JS zero-dependency dashboard (Python http.server 구동) --- ## 🔧 작업 과정 ### [1단계: 인기 유튜브 쇼츠의 편집 비밀을 파헤치다] - 레퍼런스의 스타일 요소 정밀 분석 제일 먼저 해야 할 일은 시청자의 눈길을 사로잡은 잘 만든 유튜브 쇼츠(세모내모 채널 등)의 편집 기법을 온전히 훔쳐 오는 것이었습니다. 저는 레퍼런스 비디오를 AI에게 넘겨주며 내용이 아닌 '비주얼 스펙'만 정밀하게 뜯어봐 달라고 요청했습니다. ``` 아래 참고 영상의 내용은 따라하지 말고 편집 스타일만 분석해줘. 참고 영상: https://youtube.com/shorts/dCR-fGe9_iQ?si=KOuID21fr5U_uBNy 분석 구간: 0:00~0:20 ``` AI는 영상을 읽고 비개발자인 저로서는 놓치기 쉬운 디자인 요소들을 다음과 같이 완벽한 기획 스펙서로 일목요연하게 구조화해 주었습니다. - **배경 연출**: 원본 화면을 바깥 영역에 넓게 배치한 뒤 강한 가우시안 블러(Gaussian Blur) 처리를 하여 아늑하고 트렌디한 깊이감 부여 - **중앙 카드**: 모서리가 둥글게 깎인 반투명 중앙 포커스 카드를 배치하여 스마트폰 시청자들이 정보에 완전히 집중할 수 있게 설계 - **자막 폰트**: 배경과 확연히 대조되도록 두껍고 짙은 텍스트 스트로크(외곽선)를 적용해 가독성 극대화 - **레이아웃 장식**: 화면 상단에 일관된 로고 배너와 카테고리 태그를 삽입해 전문 브랜드 필름으로서의 신뢰감 확보 --- ### [2단계: Remotion 리액트 코드로 마법의 프레임 이식하기] - 템플릿화와 카드 비율 미세조정 분석 완료된 스펙을 토대로 저는 AI에게 저희 '카페메이트' 숏폼 시리즈에 이 트렌디한 편집 스타일을 온전히 녹여낸 버전 2 리액트 합성 컴포넌트를 빌드해 달라고 요청했습니다. ``` 카페메이트 마스코트 숏폼 시리즈 영상을 새로운 편집 스타일을 적용해서 버전2로 만들어줘. ``` AI는 즉시 소스코드 파일을 뜯어 컴포넌트를 고도화하기 시작했습니다. 원본 영상을 복사해 배경으로 깔고 가우시안 블러 스타일을 준 뒤, 그 위에 모서리가 둥글고 원목 느낌이 나는 줌-인 효과의 중앙 프레임 카드를 얹었습니다. 그리고 텍스트 스트로크가 적용된 자막을 spring 애니메이션 모션과 함께 중앙 하단에 배치했습니다. 하지만 첫 테스트 빌드를 돌렸을 때 카드 테두리의 블러 영역이 지나치게 두꺼워 중앙의 예쁜 카페 이미지들이 작게 갇혀 있는 느낌이 들었습니다. 저는 즉각 구체적인 수치 피드백을 주었습니다. ``` 블러처리된 테두리를 좀 더 얇게 해줘 ``` AI는 이 피드백을 받아들여 중앙 카드의 가로 폭 비율을 기존 90%에서 **94%**로 넓히고, 세로 높이 역시 54%에서 **64%**로 확장하여 테두리 블러 비율을 슬림하게 깎아냈습니다. 상단 top 마진도 14%로 완벽하게 미세 조정하여 시각적 답답함을 완전히 털어냈습니다. --- ### [3단계: 평생 우려먹는 템플릿 완성] - 단 5분 만에 버전별 렌더링 무한 복제 및 이력 보관 이렇게 완성한 프레임(폼)이 일회성에 그치지 않도록, AI는 설정 파일(JSON)의 텍스트 대사들과 이미지 리소스 경로들만 변경하면 리모션 합성 빌더가 즉각 동일한 비율과 블러 모션을 지닌 새 영상으로 출력하도록 시스템 파이프라인을 완전히 구축해 주었습니다. 특히 버전 간의 비주얼을 번갈아 가며 꼼꼼히 검증하고 싶었던 저를 위해, AI는 렌더링 시 기존 파일을 무작정 덮어쓰지 않도록 렌더링 코드를 유연하게 조율해 주었습니다. ``` 기존 영상과 수정된 영상 2가지 다 볼 수 있었으면 좋겠어 원래 영상은 안 보이는데 어디 있어? ``` AI는 빌드 설정 시스템을 확장하여, 동일한 소스 데이터를 기반으로 하되 스타일 옵션만 다르게 적용해 아래 3가지 버전을 각각 다른 파일로 안전하게 생성해 수납해 주었습니다. 1. `final_v1_flat.mp4` (전체 화면 꽉 찬 클래식 버전) 2. `final_v2_90.mp4` (90% 카드 레이아웃의 슬림 버전) 3. `final_v2_94.mp4` (94% 확장형 최종 트렌디 버전) 이제 저는 대시보드나 설정 JSON 파일만 열어 텍스트와 그림만 쓱 바꾸고 빌드 명령을 누르면, **단 5분 만에 2화, 3화가 똑같은 황금비율 프레임**을 입고 튀어나오는 마법 같은 대량 양산 폼을 온전히 소유하게 되었습니다. --- ### [4단계: 예상치 못한 위기 해결] - 구글 이미지/비디오 모델 정책 위반 필터 우회 작전 신나게 2차 에피소드를 생성하려는데 갑자기 예상치 못한 장벽에 부딪혔습니다. 첫 번째 씬의 캐릭터 동작을 '합장'에서 '양손을 반쯤 흔드는 제스처'로 바꾸기 위해 이미지와 비디오 프롬프트를 갱신하는 순간, 구글의 Imagen/Flow AI 엔진이 **"정책 위반(Policy Violation)"** 경고를 뱉으며 생성을 거부한 것입니다. ``` 이 프롬프트 이용하니깐 구글 정책위반이라고 하는데 어떻게 바꿔야해? ``` 당황한 저에게 AI 어시스턴트는 구글의 안전 필터 작동 원리를 명쾌하게 분석해 주었습니다. 한국인을 특정하는 단어("Korean")나 내부 고유 기호("cafe-mate"), 그리고 한글 대사가 프롬프트 텍스트에 포함되었을 때 문자 검열 필터가 민감하게 반응하여 사람 생성을 차단한 것이 원인이었습니다. AI는 두 단계에 걸쳐 프롬프트 구조 개편을 감행했습니다. - **1차 조치**: 인종/브랜드 고유 명사 대신 중립적인 옷차림과 물리적 제스처 묘사 위주로 수정 - **2차 조치 (초간결 영문 우회)**: 여전히 발생하는 검열에 대응하여 프롬프트 내 모든 한글 텍스트 대사를 완전히 배제하고, 오직 순수 100% 영문으로만 동작과 피사체를 극도로 간결하게 묘사하는 안전 프롬프트 작성 ``` 그래도 위반이라는데? ``` 이 끈질긴 2차 우회 시도를 통해 AI는 마침내 구글 정책 필터를 완벽히 통과하는 안전 코드를 찾아냈고, 마스코트가 양손을 반쯤 들어 반갑게 손을 흔들며 다정하게 손님을 맞이하는 아름다운 고품질 비디오 소스를 아무런 차단 없이 깔끔하게 추출해 내는 데 성공했습니다. --- ## ✅ 결과 (After) 이번에 구축한 Remotion 기반 '마법의 카드형 프레임 템플릿' 덕분에 숏폼 기획과 편집의 전체 게임 체인저가 되었습니다. ### Before vs After | 항목 | 기존 방식 (Before) | AI 파이프라인 (After) | |------|--------|-------| | **1편당 제작 및 편집 시간** | 약 3시간 (자막 외곽선 수동 편집, 블러 효과 재현, 비디오 크기 조정) | **단 5분** (설정 JSON 파일의 텍스트와 이미지만 갈아끼운 후 자동 빌드) | | **비주얼 브랜드 일관성** | 제작할 때마다 레이아웃과 블러 비율이 미세하게 틀어짐 | **94% 카드 프레임의 규격화**로 어떤 콘텐츠든 100% 균일한 톤앤매너 유지 | | **신규 프로젝트 양산 속도** | 새 영상 기획 시 디자인 레이아웃부터 다시 고민하고 빌드 | 이미 완성된 템플릿 폼을 그대로 가져와 **텍스트만 바꿔 즉시 양산 가능** | | **정책 규제 및 에러 해결** | 생성형 AI의 정책 필터 차단이나 기술적 오류 시 해결 방법을 몰라 중단 | AI의 **검열 원인 진단 및 우회 프롬프트 설계**로 즉각 돌파 | ### 결과물 - **버전 2 최종 완성 영상**: `projects/cafe_mate_shorts/outputs/ep01/final_v2_94.mp4` (48초, 39.6 MB, 94% 둥근 카드 프레임 및 spring 자막 모션 반영) - **버전별 비교 비디오 3종 세트**: 동일 폴더 내 flat, v2_90, v2_94 버전 보관 완료로 시각 피드백 대조 가능 --- ## 💬 이 과정에서 배운 AI 활용 팁 ### 효과적이었던 것 1. **레퍼런스 스타일 분석의 자동화**: 내가 흉내 내고 싶은 멋진 쇼츠 영상이 있다면 시간 들여 캡처하지 말고 AI에게 "이 구간의 편집 기법, 자막 스타일, 레이아웃 스펙만 뜯어서 기술적으로 요약해 줘"라고 요청하는 것이 트렌드를 흡수하는 가장 빠른 지름길입니다. 2. **템플릿과 데이터의 완전한 분리**: 비디오 코드에 값을 직접 박아 넣지(하드코딩) 마세요. `scenes.json`이나 `project.json` 같은 설정용 파일에 글씨와 이미지만 연동되게 디자인 뼈대(프레임)를 고정해 둠으로써 무한 양산 구조를 완성해야 합니다. ### 이렇게 하면 안 돼요 1. **AI 정책 필터에 정면 대결 금지**: "한국인", "브랜드명" 등에서 AI가 생성 차단 오류를 뿜을 때 억지로 단어를 반복해 넣지 마세요. 오히려 프롬프트를 100% 영문으로 바꾸고, 인물 세부 인종 명사를 일반적인 성별과 옷차림(예: black blazer) 위주의 중립적 묘사로 한 단계 낮춰 쓰는 것이 필터를 부드럽게 통과하는 요령입니다. --- ## 🌍 다른 업무에 적용한다면? - **쇼핑몰 신상품 소개 쇼츠**: 이 94% 블러 카드 템플릿 폼을 그대로 가져와서, 중앙 카드 부분에 신상 의류 이미지와 상품 설명 텍스트만 넣으면 매주 수십 개의 신상 소개 광고 영상을 10분 만에 릴스로 뽑아낼 수 있습니다. - **맛집/F&B 카드뉴스 비디오**: 매장의 신메뉴 시즐링 컷을 중앙 카드에 띄우고 하단에 텍스트 스트로크 자막을 입혀 인스타그램 릴스 및 네이버 모먼트용 홍보 클립으로 신속하게 스케일업할 수 있습니다. https://files-us-east-1.t-cdn.net/files/73XilHFJs15gHFRWcvgDS
    1
    2
  • 꽃잔치

    사랑하는 언니 결혼 축하 영상 만들기 2탄 (완성!!!!)

    * 제가 쓴게 아님다! 안티그래비티가 쓴거임 !!!!!!! 소개 시도하고자 했던 것과 그 이유를 알려주세요. 목표: "브라이덜 샤워" 비디오 프로젝트의 오디오 싱크에 맞지 않던 자막 타임라인을 완벽하게 재정렬하고, 가독성을 극대화하기 위해 한글/영문 2줄 구성의 정적 자막(움직임 없는 자막) 및 눈부심 없는 즉시 전환(Direct Cut) 형태의 가로형 영상을 성공적으로 제작 및 렌더링하는 것이었습니다. 이유: 보컬 트랙이 진행되면서 기존 자막 파일의 1분대 이후 타임라인 불일치 문제가 발생해 엉뚱한 대사들이 출력되고 있었습니다. 또한, 자막 등장 시 발생하는 모션과 장면 전환 시의 미세한 플래시 현상이 시청 시 어지러움을 유발했기에, 안정적이고 눈이 편안한 최종 결과물을 빌드하고자 했습니다. 진행 방법 어떤 도구를 사용했고, 어떻게 활용하셨나요? 도구: ChatGPT & Genspark: 사용자가 타임라인이 밀리는 오디오 데이터를 기반으로 직접 절대 타임스탬프(start_sec, end_sec)를 정밀 추출하고 자막 구조를 재배치하는 데 활용했습니다. Python & Remotion: 추출된 절대 시간을 Remotion 규격의 씬 단위 상대 시간으로 변환하고 자막을 조립 및 자동 세팅하는 파이썬 스크립트 작성에 활용했습니다. Remotion Render Engine: 가로형 영상 렌더링 파이프라인(React 기반)을 구동하고 연출 코드를 수정하는 데 사용했습니다. 1. 자막 자동 정렬 및 마침표 제거 파이썬 스크립트 Genspark v2 JSON 데이터를 읽어 씬별 재생 구간을 계산하여 병합하고, 자막 끝의 마침표(.)를 자동으로 정제해 주는 코드를 적용했습니다. python # scratch/sync_subtitles_genspark_v2.py 일부 def strip_trailing_period(text): text = text.strip() if text.endswith(".'"): text = text[:-2] + "'" elif text.endswith('."'): text = text[:-2] + '"' elif text.endswith("."): text = text[:-1] return text.strip() for cue in genspark_data["entries"]: start_abs = cue["start_sec"] end_abs = cue["end_sec"] en_clean = strip_trailing_period(cue["en"]) ko_clean = strip_trailing_period(cue["ko"]) text = f"{en_clean}\n{ko_clean}" # scenes.json의 누적 시간과 매핑하여 상대적 start, end 계산 후 subtitles.json에 기록 2. 자막 무빙 비활성화 및 렌더링 에러 우회 자막 무빙 애니메이션을 제거하고, 매우 짧은 자막이 나올 때 시간 보간 함수(interpolate)에서 발생하는 수학적 정렬 에러를 조건문으로 우회했습니다. typescript // remotion/SceneClip.tsx (CaptionBurst 컴포넌트 수정본) const CaptionBurst: React.FC<{cue: CaptionCue; frame: number; speedFactor?: number}> = ({cue, frame, speedFactor = 1.0}) => { const start = cue.start speedFactor FPS; const end = cue.end speedFactor FPS; const isBridalShower = project.id === "bridal-shower"; // 브라이덜 샤워 프로젝트는 어지러움을 막기 위해 페이드/스케일/무빙 애니메이션을 완전히 생략하고 정적으로 노출 if (isBridalShower) { if (frame < start || frame > end) { return null; } const align = cue.align ?? "left"; const translateX = align === "center" ? "-50%" : align === "right" ? "-100%" : "0"; return ( <div style={{ position: "absolute", left: ${cue.x}%, top: ${cue.y}%, transform: translate(${translateX}, -50%) scale(1), opacity: 1, zIndex: 20, width: "90%", maxWidth: "1400px" }}> <div style={{ position: "relative", color: "#ffffff", textShadow: "0px 0px 4px #000000, -1.5px -1.5px 0 #000000, 1.5px -1.5px 0 #000000, -1.5px 1.5px 0 #000000, 1.5px 1.5px 0 #000000", fontFamily: "Pretendard, sans-serif", fontSize: cue.size ? cue.size * 0.75 : 40, fontWeight: 500, lineHeight: 1.4, textAlign: "center", whiteSpace: "pre-line" }}> {cue.text} </div> </div> ); } // 타 프로젝트용 애니메이션 보간 계산 (브라이덜 샤워는 타임 에러 방지를 위해 이 계산 과정을 아예 거치지 않음) const opacity = interpolate(frame, [start, start + 3, end - 5, end], [0, 1, 1, 0], { extrapolateLeft: "clamp", extrapolateRight: "clamp" }); // ... 생략 ... 결과와 배운 점 배운 점과 나만의 꿀팁을 알려주세요. 정적 자막의 중요성: 템플릿에 내장된 화려한 무빙 자막이 짧고 정보량이 많은 한/영 다중 레이아웃 자막과 결합하면 시각적 노이즈가 되어 가독성을 해치고 몰입을 방해할 수 있습니다. 상황에 따라 과감히 애니메이션을 끄는 것이 완성도를 높이는 꿀팁입니다. 디렉트 컷(Direct Cut) 전환: 슬라이드 형태의 영상에서 씬 경계마다 페이드인/아웃을 무조건 적용하면, 부모 배경색 노출로 인한 화면 깜빡임이 생겨 피로감이 커집니다. 화면 전환은 컷 단위로 즉각 붙이는 것이 훨씬 세련됩니다. 과정 중에 어떤 시행착오를 겪었나요? 싱크 어긋남 오류: 1분대 이후부터 음악 내부 벌스(Verse) 편집 구조로 인해 타임라인이 뒤엉키던 문제. 극복: 외부 AI 도구(Genspark, ChatGPT)를 통해 절대 오디오 스탬프를 정밀 복원한 뒤, 파이썬 매퍼를 개발하여 30개 전체 씬 구간에 정확히 밀착시켰습니다. 메모리 초과 크래시 (EPIPE Error): 5분에 달하는 긴 영상을 고해상도 렌더링하면서 Puppeteer 크롬 프로세스들이 메모리 부족으로 터지던 현상. 극복: 렌더링 스크립트(render_episode.mjs)에 동시성 제한 인자(--concurrency=2)를 추가하여 하드웨어 부하를 조절함으로써 9,270프레임을 에러 없이 무사히 완주했습니다. 시간 보간 값 엇갈림 오류 (monotonically increasing): 자막 유지 시간이 너무 짧은 구간에서 모션용 보간 배열(ex: 3초 지점과 1.6초 지점의 충돌)이 정렬되지 않아 컴파일 에러가 발생한 현상. 극복: 렌더러가 브라이덜 샤워 프로젝트일 때 보간 로직 자체를 건너뛰고 정적 컴포넌트를 즉시 반환하게 하여 에러 원인을 근본적으로 도려냈습니다. 장면 전환 시 흰색 화면 깜빡임: 씬과 씬 사이의 디졸브 페이드 과정에서 하단의 연한 미색 배경이 비쳐 눈부심과 어지러움을 가중시켰던 현상. 극복: 씬 전환 페이드를 제거해 즉시 화면이 전환되게 처리하고 부모 배경색 또한 어두운 톤(#080b11)으로 안전 조치하여 완벽한 전환 연출을 완성했습니다. 도움이 필요한 부분이 있나요? 현재는 해결되어 추가적인 기술적 도움은 필요하지 않습니다. 앞으로의 계획이 있다면 들려주세요. 이번 가로형 원본 제작 및 싱크 제어 노하우를 바탕으로, 핵심 하이라이트만을 깔끔하게 압축한 3분 내외의 세련된 숏폼 요약 버전 동영상을 추가 제작할 계획입니다. 도움 받은 글 (옵션) 참고한 지피터스 글이나 외부 사례를 알려주세요. 지피터스 AI 비디오 포럼 및 Remotion 공식 가이드: 대용량 비디오 렌더링 시 브라우저 동시성 제한 설정(--concurrency)과 Puppeteer 메모리 프로파일 관련 튜닝 트러블슈팅 사례를 참고하여 크래시 현상을 돌파했습니다. 유튜브 최종 업로드 영상 링크: https://youtu.be/FAZEJBbWtzU 다음번엔 축사 영상 3분내로 줄일거고 다음 프로젝트는 명인 선생님들 인생 애니메이션 시리즈 만들거에요!!!!! 영상 배우길 잘했다!!!! 22기 끌림영상 대박!!!
    1
    1
  • 플로우 이용해서 첫 영상 완성

    소개 새로운 영상을 스터디장님이 준 대시보드에 맞게 다 완성하는것 (내용 입력) 진행 방법 드디어 구글 제미나이 울트라 가족 요금제 가입해서 플로우로 에피소트 1 영상완성 결과와 배운 점 여전히 내가 뭘 하는지, 활용은 맞게 하는건지, 배운것과 스스로 실행할때 , 내가 알고 하고 있는지 모르는 단계이나 열심히 해보겠습니다. 도움 받은 글 (옵션) 참고한 지피터스 글이나 외부 사례를 알려주세요. (내용 입력)
    2
    1
  • 구글 플로우와 레퍼런스 프롬프트로 배드민턴 스매싱 숏폼 개선해보기

    소개 배드민턴 스매싱을 설명하는 숏폼 영상을 만들고 있었는데 처음 만든 영상은 설명과 시범이 조금 밋밋하고 동작이 충분히 역동적으로 보이지 않았습니다. 강의에서 배운 것처럼 레퍼런스 영상을 참고해서 “그대로 따라 하는 것”이 아니라 레퍼런스의 편집 문법과 동작 느낌만 분석해 제 영상에 적용해보려고 했습니다. 목표는 스매싱 칠 때 시범 장면을 보여주고 신경 써야 할 포인트를 설명하해주는 숏폼을 만드는 것이었습니다. 시도하고자 했던 것과 그 이유를 알려주세요. 제가 만들고 싶었던 영상은 배드민턴 스매싱 코칭 숏폼이었습니다. 처음에는 여성 코치가 "점프 스매싱 할 때 신경 써야 할 3가지를 아시나요?"이렇게 물어본 후 뒤에서 스매싱 시범을 보여주고 설명하는 구조를 생각했습니다. 그런데 기존 영상은 시범 장면이 너무 정적이고 실제 스매싱처럼 전신을 써서 뛰고 치는 느낌이 부족했습니다. 그래서 레퍼런스 영상에서 배드민턴 기술 전체를 참고하기보다는 스매싱 순간의 속도감, 타격감, 구도, 컷 리듬만 참고해서 제 영상에 적용해보고자 했습니다. https://www.youtube.com/shorts/kdltusz89Wc 특히 개선하고 싶었던 부분은 다음과 같았습니다. 첫 시범 장면이 더 빠르고 믿음직하게 보이기 오른발을 뒤로 빼고 몸을 옆으로 여는 백스윙 자세 만들기 점프 후 높은 타점에서 스윙하기 라켓 면에 셔틀콕이 자연스럽게 맞는 장면 만들기 너무 과한 효과 없이, 실제 코칭 영상처럼 보이게 만들기 진행 방법 사용한 도구는 구글 플로우와 레퍼런스 프롬프트였습니다. 처음에는 제가 만든 영상을 첨부하고 더 역동적인 배드민턴 스매싱 영상으로 만들어달라는 식으로 요청했습니다. 하지만 결과물에서 설명 부분이 사라지거나 3가지라는 말을 너무 반복하거나, 셔틀콕이 여러 개처럼 보이는 문제가 생겼습니다. 그래서 프롬프트를 점점 더 구체적으로 수정했습니다. 처음 사용한 방향은 아래와 같았습니다. 첨부한 10초 영상을 참고해, 같은 메시지와 흐름을 유지하되 더 역동적인 세로 숏폼 영상 소스로 재구성한다. 첫 3초는 시선을 멈추게 할 만큼 강한 움직임과 명확한 액션감이 느껴지게 한다. 중간 구간은 짧고 선명한 동작 변화로 리듬감을 만든다. 마지막 1초는 편집에서 결론이나 CTA를 얹기 좋도록 화면이 너무 복잡하지 않게 정리한다. 영상에는 자막, 텍스트, 로고, UI, 스티커, 그래픽 효과를 넣지 않는다. 그런데 이 방식은 영상 전체를 너무 많이 바꿔버려서 설명이 날아가거나 동작이 어색해졌습니다. 이후에는 강의에서 배운 레퍼런스 프롬프트 방식처럼 레퍼런스를 “복제 대상”이 아니라 “분석 대상”으로 바꿨습니다. 레퍼런스 영상의 배드민턴 스매싱 장면에서 느껴지는 타격감과 역동성만 참고한다. 영상 내용, 문구, 인물, 브랜드, 구도, 디자인은 복제하지 않는다. 참고할 요소는 컷 속도, 자막 타격감, 줌/흔들림, SFX 타이밍, 순간 강조 효과로 제한한다. 이후에는 시범 영상만 따로 만들고 동작 교정 프롬프트를 계속 추가했습니다. 예를 들어 백스윙 자세를 만들기 위해 이런 식으로 썼습니다. 준비 자세에서 오른발을 뒤로 길게 빼며 몸을 사선으로 만든다. 점프 직전에는 상체 정면이 카메라가 아니라 오른쪽 방향을 볼 정도로 몸이 충분히 옆으로 돌아가 있어야 한다. 오른쪽 어깨가 뒤로 열리고, 가슴이 활짝 열리는 자세가 보여야 한다. 라켓은 머리 뒤쪽에서 충분한 백스윙을 만든다. 점프 후 팔을 위로 길게 뻗어 높은 타점에서 셔틀콕을 보낸다. 추가로 백스윙 참고 이미지를 넣고 사진 속 인물이나 외형은 복제하지 말고 자세만 참고하도록 요청했습니다. 추가로 첨부한 사진은 백스윙 자세 참고용이다. 사진 속 인물이나 외형을 복제하지 말고, 오직 점프 중 백스윙 자세와 몸의 방향만 참고한다. 이렇게 하니 자세는 훨씬 좋아졌습니다. 오른발을 뒤로 빼고 가슴을 열고 라켓을 머리 뒤쪽으로 당기는 느낌이 이전보다 잘 나왔습니다. 하지만 끝까지 해결이 어려웠던 부분도 있었습니다. 셔틀콕이 라켓 거트 면에 정확히 맞지 않고 라켓 샤프트나 어색한 위치에 닿는 것처럼 보였습니다. 또 점프 타이밍이 자연스럽지 않아 코치가 공중에 오래 떠 있다가 셔틀콕을 기다리는 듯한 장면이 계속 나왔습니다. 그래서 마지막에는 이렇게 프롬프트를 수정했습니다. 가장 중요한 수정은 공중 체공 시간 감소와 점프 최고점 직후 바로 하강하는 중력감이다. 코치는 셔틀콕을 지면에서 조금 더 기다린 뒤, 더 늦은 타이밍에 짧게 점프한다. 점프 후에는 실제 중력처럼 몸이 자연스럽게 상승하고, 최고점에 도달한 직후 바로 내려오기 시작한다. 스윙은 몸이 공중에서 멈춘 상태가 아니라, 최고점 직후 몸이 내려오기 시작하는 자연스러운 순간에 이어진다. 결과와 배운 점 이번 과정에서 가장 크게 배운 점은 AI 영상 생성에서는 “멋있게 만들어줘”보다 “무엇을 유지하고, 무엇만 수정할지”를 구체적으로 말해야 한다는 점이었습니다. 특히 좋았던 방식은 다음과 같습니다. 영상 전체를 다시 만들라고 하지 않고 현재 구도는 유지하고 점프 타이밍만 수정처럼 범위를 좁히기 레퍼런스는 내용 복제가 아니라 동작, 리듬, 느낌만 참고하게 하기 스매싱이라는 추상 표현보다 오른발을 뒤로 빼기, 몸을 옆으로 돌리기, 가슴 열기, 백스윙, 높은 타점처럼 동작 단위로 쓰기 참고 이미지를 넣을 때는 외형 복제 금지 자세만 참고라고 명확히 쓰기 시행착오도 많았습니다. 처음에는 설명 영상과 시범 영상을 한 번에 만들려고 했는데, 그러면 설명이 사라지거나 같은 말이 반복되는 문제가 생겼습니다. 또 셔틀콕이 여러 개처럼 보이거나, 점프를 두 번 하는 장면도 나왔습니다. 그래서 나중에는 설명 영상과 시범 영상을 분리하는 쪽이 더 낫겠다고 느꼈습니다. 구글 플로우: 배경 영상, 시범 동작, 코칭 장면 소스 생성 Remotion: 자막, 줌, SFX, 컷 편집, 타격감 보정 이렇게 역할을 나누는 게 더 안정적일 것 같습니다. 제가 도움을 받고 싶은 부분은 여기입니다. AI 영상에서 점프 스매싱 장면을 만들 때, 셔틀콕이 라켓 면에 정확히 맞는 프레임과 자연스러운 중력감을 끝까지 해결하기 어려웠습니다. 혹시 Remotion에서 이런 식으로 보정하는 게 가능할까요? 예를 들어 1. 점프 구간만 속도를 빠르게 조정한다거나 2. 어색한 임팩트 프레임을 잘라내고 3. 셔틀콕 이동 효과를 따로 얹는 방식으로 더 자연스럽게 만드는 방법 같은거요.. 가능하다면 어떤 식으로 컷을 나누고 어떤 타이밍에 효과를 넣을 수 있을지 자문을 구하고 싶습니다..2시간 붙잡고 있다가 포기했네요.. 그래서 다음에는 처음에 인트로 + 시범 영상 + 시범 영상 슬로우 모션과 함께 설명 영상도 만들어 보고 싶고 성공만 한다면 다양하게 더 만들 수도 있을 것 같습니다. 도움 받은 글 강의에서 배운 레퍼런스 프롬프트 방식을 참고했습니다. 특히 레퍼런스를 그대로 따라 하지 않고 분석 구간을 정해서 편집 문법만 가져오기라는 방식이 도움이 되었습니다. 선수의 스매싱 레퍼런스 영상 전체가 아니라 스매싱 장면의 속도감과 타격감만 참고하는 것처럼 말이죠. 덕분에 프롬프트도 단순히 “비슷하게 만들어줘”가 아니라, “컷 속도, 동작 리듬, 백스윙 자세, 점프 타이밍만 참고”하는 식으로 더 구체화할 수 있었습니다.
    0
    1
  • [Remotion/Veo] AI 숏폼 영상 자동 합성 시 발생하는 렌더링·캐시 버그 해결하기

    소개 구글 플로우(Veo)로 생성한 숏폼 영상 클립들을 하네스(Harness) 저장소의 Remotion 코드를 활용해 하나의 최종 영상(mp4)으로 자동 합성하고자 했습니다. AI 영상의 고질적인 문제인 '긴 씬에서의 뭉개짐'을 피하기 위해 1씬을 2~3초 단위의 짧은 컷(Short-cut)으로 쪼개어 생성한 후, 이를 매끄럽게 하나로 이어 붙여 고품질의 쇼츠를 완성하는 것이 목표였습니다. 진행 방법 어떤 도구를 사용했고, 어떻게 활용하셨나요? 영상 생성: 구글 플로우(Veo)를 활용해 2~3초 단위로 잘게 쪼갠 고밀도 프롬프트로 씬을 생성했습니다. 자동 합성 및 렌더링: 로컬 환경에서 Node.js 기반의 Remotion 패키지를 이용해 여러 mp4 클립을 하나의 영상으로 렌더링(npm run render)했습니다. AI 코딩 어시스턴트: 렌더링 과정에서 발생하는 윈도우 환경 에러, 캐시 오류, 하드코딩된 UI 버그 등을 실시간으로 진단하고 코드를 뜯어고치는 페어 프로그래밍을 진행했습니다. Tip: 사용한 프롬프트 전문을 꼭 포함하고, 내용을 짧게 소개해 주세요. (에이전트와 진행한 핵심 트러블슈팅 프롬프트) "아니 근데 김푸들 영상에 막막했죠? 순서도 이런 자막이 내 영상 자막이 아닌데, 다른 프로젝트 영상 자막이 들어가 있어. 수정해 줘." "파이널 잘 봤고 보니까 영상들 붙여넣기 해보니까 중간에 pause도 있고 자연스럽게 이어지지가 않는 단점이 있네" Tip: 코드 전문은 코드블록에 감싸서 작성해주세요. 윈도우(Windows) 환경에서 Remotion 렌더링 스크립트를 실행할 때 발생한 주요 버그들을 다음과 같이 패치했습니다. 띄어쓰기 폴더 경로 오류 해결 경로에 띄어쓰기가 있을 경우 경로가 잘려 C:\dev\ai.mp4 처럼 엉뚱한 곳에 저장되는 문제를 막기 위해 경로를 따옴표로 감쌌습니다. // scripts/render_episode.mjs const args = [ "remotion", "render", "remotion/index.ts", episode-${episodeId}, "${outputPath}", // 큰따옴표 처리 추가 ]; 뚝 끊기는 화면 전환(Fade) 제거 및 하드 컷(Hard Cut) 적용 씬 사이에 배경색이 드러나며 멈칫거리는 느낌을 지우기 위해 투명도(opacity) 애니메이션을 제거했습니다. tsx // remotion/SceneClip.tsx return ( <AbsoluteFill style={{backgroundColor: "#f7f4ee"}}> <AbsoluteFill> {video ? ( <OffthreadVideo src={video.src} ... /> 원치 않는 다른 프로젝트의 자막 오버레이 제거 tsx // remotion/SceneClip.tsx const KineticCaptions: React.FC<{scene: KkulimScene; frame: number}> = ({scene, frame}) => { // project.json 설정에서 자막이 꺼져 있으면 특수 자막 렌더링 방지 if (project.elements?.subtitles?.enabled === false) return null; // ... }; 결과와 배운 점 배운 점과 나만의 꿀팁을 알려주세요. AI로 영상을 생성할 때 하나의 프롬프트로 68초를 통째로 맡기면 동작이 뭉개지거나 지루해지기 쉽습니다. 1개 씬을 A/B 컷으로 23초씩 짧게 쪼개어 구글 플로우에 넣고, 이를 프로그래밍(Remotion)이나 캡컷(CapCut)으로 이어 붙이는 '하드 컷' 방식이 훨씬 역동적이고 실감 나는 결과물을 만든다는 것을 배웠습니다. 과정 중에 어떤 시행착오를 겪었나요? 윈도우(Windows) 환경의 함정: npx 명령어를 spawn 할 때 shell 옵션 누락으로 인한 에러, 띄어쓰기 폴더명 에러, Remotion 자체 크롬 다운로드 실패 등 윈도우 특유의 자잘한 터미널 버그를 많이 겪었습니다. 캐시 및 하드코딩의 늪: 같은 씬 아이디(ep01-s01)를 쓴다는 이유로 이전 프로젝트의 자막 코드가 제 영상에 강제로 덧씌워지는 황당한 이슈가 있었습니다. AI 어시스턴트에게 상황을 있는 그대로 직설적으로 따지듯(?) 말하니, 즉시 코드를 파헤쳐 원인을 찾아냈습니다. 도움이 필요한 부분이 있나요? 각 mp4 파일의 실제 재생 길이를 Remotion이나 스크립트가 자동으로 정확히 읽어내어 scenes.json의 duration_sec 값을 오차 없이 맞춰주는 자동화 기능이 Node.js 서버 단에서 완벽하게 돌아가면 좋겠습니다. (현재는 브라우저 API 의존 문제로 수동으로 길이를 맞춰줘야 하는 번거로움이 있습니다.) 앞으로의 계획이 있다면 들려주세요. 이제 영상 합성을 위한 하네스 뼈대가 단단하게 구축되었고 버그도 잡혔으니, 본격적으로 에피소드들을 쭉쭉 찍어내며 퀄리티업을 해보고 싶습니다!
    1
    1
  • 어떻게 하면 한 방에 원하는 영상이 나올까?

    한방에 끝내기 도전 [소개] 어떻게 하면 한 방에 원하는 영상이 나올까? 지난주 춤추는 병아리 영상을 만들면서 깨달은 것이 있다. 헛발질의 연속...... 영상 하나 만들자고 시작했는데, 어느새 버려진 영상들이 조용히 쌓여가고 있었다. 이걸 만들다가 저걸 고치고, 저걸 고치다가 또 처음부터 다시. 영상은 하나인데 필요없는거....수백개.... 그 잔해들을 바라보며 결심했다. "이번 주는 다르다." 그래서 야심차게, 나름 치밀하게, 거의 작전처럼 준비했다. 그냥 만드는 게 아니라 설계하는 것이다. 이번 주 목표는 딱 두 가지였다. 첫 번째, 버려지는 영상 없애기. 두 번째, 유튜브 채널 새로 파서 꾸준히 운영하기. 채널 방향도 정했다. 한국 동요 쇼츠 채널. 누구나 따라 부를 수 있는 그 짧고 쉬운 노래들. 좀 있으면 방학이니....시간이 좀 나겠지... [진행 방법] 이번 작업의 핵심은 AI를 혼자 쓰지 않는 것이었다. AI를 릴레이처럼 이어 붙이는 작전. 각자 잘하는 것만 시키는 분업 체계를 구축했다. 작업 순서는 이렇다. 1단계 — Suno로 노래 생성 먼저 Suno에서 한국 동요를 만들었다. 기존에 음원은 내 소유인 것이 있어서, 그 영어 동요 음원을 넣고 한국어로 바꾸었다. (가사는 한국어로 번안했을 때 가장 그럴싸 한것으로 제미나이, 챗지피티, 클로드 모두에게 시켜서 제일 마음에 와 닿는 것으로 선택했다). 노래가 원본보다 더 잘 나왔다...너모 좋잖아~~~~역시 suno! 2단계 — Gemini로 노래 초단위 분석 만들어진 노래를 Gemini한테 넘겼다. "이 노래에서 몇 초에 뭐가 나오는지 분석해줘." 간주가 어디서 시작되는지, 가사가 바뀌는 지점은 어딘지를 초단위로 뽑아냈다. 영상 편집의 설계도가 되는 작업이다. 그리고 혹시, 까먹을까봐 매번 새로운 마음으로 화면 비율도 계속 이야기 해줌. 3단계 — ChatGPT로 이미지 생성 분석된 타임라인을 바탕으로 각 구간에 필요한 이미지를 ChatGPT에서 생성했다. 이미지가 완벽해야 영상이 완벽하다! 이렇게해서 완성된 이미지들 순서대로 넘버링! 4단계 — ChatGPT로 Grok용 프롬프트 작성 + 시뮬레이션 여기가 핵심이다. Grok에 바로 넣기 전에, ChatGPT한테 프롬프트를 먼저 써달라고 했다. 그리고 "이 프롬프트로 영상 만들면 어떤 그림이 나올 것 같아?" 하고 머릿속 시뮬레이션을 돌렸다. 일종의 리허설이다. 이 단계 덕분에 Grok에서 헛방을 많이 줄일 수 있었다. 위의 이미지들 넣고, 이 이미지를 움직이도록 영어 프롬프팅작성해서 얻은 영상들...... 순간 방심하여 헛방질 한 영상들 여전히 존재................. 5단계 — Grok으로 영상 생성 준비가 끝났으니 Grok 투입. 프롬프트가 이미 검증된 상태라 생각보다 훨씬 원하는 결과가 나왔다. 그래도 지난 주에 비하면.....헛방질 개수 줄어들었음에 용기를 얻자.. 6단계 — ElevenLabs로 효과음 생성 영상을 보면서 효과음이 들어가면 좋겠다 싶은 지점들을 표시해뒀다. 그 타이밍에 맞게 ElevenLabs에서 효과음을 생성했다. (더빙이 이번주 과제였는데...노래다 보니 더빙할 부분이.....마땅치가 않아서, 효과음이라도 넣어보자는 마음에 추가) 7단계 — CapCut으로 최종 편집 모든 미디어를 CapCut에 불러와서 편집했다. 중요한 건 무료 기능만 썼다는 것. 돈 안 쓰고도 충분히 제작은 가능했으나, 돈 좀 내고 펑펑 쓰는게 마음 편할 것 같다! https://youtube.com/shorts/sK-o9g24sb8?si=8M4VIztOrIA800gk [결과 & 배운 점] 지난주 교훈을 가슴에 새기고, 이번엔 전략을 짜서 원샷원킬!하자는 목표였다....그러나....여전히 힘든 과정.... Grok 무료 버전은 하루 생성 한도가 있으니, 2일 안에 치고 빠지는 구조로 가자. 첫째 날 최대한 뽑고, 둘째 날로 기약하는 방식. 결정적으로 달라진 건 속도였다. 지난주에는 생각없이 영상 생성하다가 엉뚱한 게 많이 나왔었다. 이번 주는 지난주 경험을 바탕으로 설계를 하고 실행했더니, 영상의 수가 눈에 띄게 줄었다. 완벽하진 않았지만..... 토욥님꼐서 채팅방에서 팁을 무한으로 공유해주고 계셔서 덕분에 다음에 시도해볼 것도 산더미다. 이게 또 다른 행복한 고민이다. 이번 주 정리하면서 느낀 것들: 반복과 연습만이 살길이다. 처음부터 잘하는 사람은 없다. 영상 하나 만들 때마다 조금씩 빨라지고 있다. 지난주의 나보다 이번 주의 내가 분명히 낫다. 실수한 만큼 성장한다. 지난주에 버렸던 영상들이 사실 이번 주의 설계도가 됐다. 헛발질도 데이터다. [다음 주 계획] 더 철저히 준비해서, 버려지는 영상 제로 도전! 🔥
    1
    2
  • 컨토리가 말을 시작했습니다: 지원센터 소개 영상 제작 도전기

    소개 지난번에는 무역 컨테이너 캐릭터인 ‘컨토리(ConTory)’를 기획하고, 캐릭터 주제가를 만들어 짧은 뮤직비디오 형태의 영상을 제작해보았습니다. 이번에는 한 단계 더 나아가 컨토리에게 가상의 목소리를 입혀보기로 했습니다. AI무역지원센터를 컨토리가 직접 소개하는 2분 이내의 짧은 영상을 만들어보는 것이 이번 실습의 목표였습니다. 컨토리는 글로벌 시장을 여행하며 수출입 실무를 쉽게 알려주는 컨테이너 캐릭터입니다. 단순히 귀여운 마스코트로만 활용하기보다는, 앞으로 무역 실무와 해외 마케팅 정보를 친근하게 설명해주는 안내자 역할을 맡기고 싶었습니다. 이번 영상은 컨토리가 처음으로 실제 대사를 말하는 콘텐츠이기 때문에, 영상보다 먼저 나레이션 대사를 만들고 그 흐름에 맞춰 장면을 구성했습니다. 진행 방법 이번 작업은 아래 순서로 진행했습니다. 1. 나레이션 대사 작성하기 먼저 ChatGPT와 함께 AI무역지원센터를 소개하는 대사를 작성했습니다. 영상 길이는 2분 이내로 잡았고, 이후 영상 생성이 편하도록 대사를 6초 단위로 나누었습니다. 최종적으로는 16개의 짧은 클립으로 구성했습니다. AI무역지원센터에서 지원하는 주요 내용을 너무 딱딱하게 나열하기보다는, 해외 진출을 처음 준비하는 중소기업 대표님들이 실제로 고민할 만한 질문부터 시작했습니다. 예를 들면 아래와 같은 방식입니다. 좋은 제품을 가지고 있지만, 해외 진출이 막막하신가요? 제품 사진은 어떻게 준비하고, 영문 상품페이지는 어떻게 만들까요? 우리 제품에 관심을 가질 해외 바이어는 어디에서 찾아야 할까요? 이후에는 제품 촬영, 이미지 제작, buyKOREA 상품등록, 해외시장 조사, 관심 바이어 발굴, 디지털 마케팅, 화상상담 지원 순서로 내용을 연결했습니다. 2. 대사에 맞춰 스토리보드 만들기 대사가 정해진 다음에는 각 클립에 맞는 이미지를 만들었습니다. 처음에는 전체 흐름을 확인하기 위해 4×4 형태의 스토리보드를 만들고, 이후 실제 영상 생성에 활용할 수 있도록 장면별 이미지를 하나씩 따로 생성했습니다. 이미지를 만들 때는 컨토리 캐릭터의 외형이 크게 달라지지 않도록 기존 캐릭터 시트를 기준으로 삼았습니다. 또한 실제 영상 제작용 이미지이기 때문에, 이미지 안에 번호나 설명 문구가 들어가지 않도록 요청했습니다. 3. 슈퍼톤 플레이에서 컨토리 목소리 만들기 이번 작업에서 새롭게 사용해본 도구는 ‘슈퍼톤 플레이’입니다. 여러 음성을 비교해보면서 컨토리의 성격과 가장 잘 어울리는 목소리를 골랐습니다. 컨토리는 귀여운 캐릭터이지만, 무역 실무를 알려주는 역할도 맡아야 합니다. 그래서 지나치게 어린아이 같은 목소리보다는 밝고 친근하면서도 설명이 또렷하게 들리는 목소리를 선택하려고 했으나, 에니메이션틱한 캐릭터 이미지 때문에 어쩔 수 없이 조금 귀여운 목소로리 고르게 되었네요. 대사는 한 번에 길게 녹음하기보다, 영상 흐름에 맞춰 짧게 나누어 생성했습니다. 4. Grok에서 영상 클립 만들기 스토리보드 이미지를 Grok으로 옮겨 짧은 영상 클립을 생성했습니다. 이번에는 각각의 이미지가 6초 정도 움직이도록 만들고, 컨토리가 손을 흔들거나 화면을 가리키고, 대표님과 이야기를 나누는 등의 간단한 움직임을 넣었습니다. 영상 클립을 만들 때는 장면별로 하나씩 생성한 뒤, 전체 흐름에서 부족한 장면이 있으면 새로운 이미지를 추가로 만들고 다시 영상화하는 방식으로 진행했습니다. 5. Suno에서 배경음악 만들기 나레이션이 중심인 영상이기 때문에 배경음악은 너무 튀지 않도록 만들었습니다. 6. CapCut에서 하나의 영상으로 연결하기 마지막으로 CapCut에서 앞에서 만든 나레이션, 영상 클립, 배경음악을 하나로 연결했습니다. CapCut에서는 주로 아래 작업을 했습니다. 영상 클립 순서 배치 배경음악 볼륨 낮추기 전체 영상 흐름 점검하기 결과와 배운 점 이번 작업을 하면서 가장 크게 느낀 점은, 음성이 들어가는 영상은 음악 중심의 영상과 제작 방식이 확실히 다르다는 것이었습니다. 지난번 컨토리 주제가 영상은 노래에 맞춰 다양한 장면을 연결하면 되었기 때문에, 캐릭터의 입 모양이 정확하게 맞지 않아도 크게 어색하지 않았습니다. 하지만 이번에는 컨토리가 직접 AI무역지원센터를 소개하는 형태였기 때문에, 나레이션과 캐릭터의 입 모양이 맞지 않으면 생각보다 어색하게 느껴졌습니다. 아직은 음성과 영상의 입 모양을 자연스럽게 맞추는 요령을 잘 모르겠습니다. 단순히 이미지를 움직이는 방식만으로는 한계가 있다는 점을 느꼈고, 앞으로 립싱크 기능을 지원하는 도구나 더 자연스러운 영상 제작 방법을 추가로 공부해보고 싶습니다. 또 하나의 시행착오는 Grok의 토큰 제한이었습니다. 16개 클립을 모두 만들려고 했지만, 한 번에 필요한 영상을 전부 생성하지 못했습니다. 그래서 오늘은 우선 일부 클립으로 만든 미완성본을 제출하고, 이후 부족한 장면을 추가로 생성해 최종 영상을 다시 업로드할 예정입니다. 완성도가 충분하지 않은 상태에서 사례글을 올려도 될지 잠시 고민했습니다. 하지만 이번 실습의 목적은 완벽한 결과물을 자랑하는 것이 아니라, 직접 도구를 사용해보고 시행착오를 기록하는 것이라고 생각했습니다. 부족한 부분까지 남겨두면 나중에 최종본과 비교하면서 얼마나 개선되었는지 확인할 수도 있을 것 같습니다. 이번 작업을 통해 얻은 저만의 팁은 다음과 같습니다. 음성 중심 영상은 스토리보드보다 대사를 먼저 만들어야 합니다. 영상 생성이 편하도록 대사를 5~6초 단위로 나누면 좋습니다. 한 번에 모든 영상을 만들기보다, 장면별로 만들고 부족한 부분을 추가하는 방식이 효율적입니다. 나레이션 중심 영상의 배경음악은 존재감이 너무 강하지 않아야 합니다. 캐릭터 영상은 이미지 일관성뿐 아니라 입 모양과 표정 변화도 중요합니다. 앞으로는 부족한 영상 클립을 추가해서 소개 영상의 최종본을 완성해보려고 합니다. 그리고 컨토리가 단순히 주제가 영상에만 등장하는 캐릭터가 아니라, 무역 실무와 해외 마케팅을 쉽게 설명하는 교육형 콘텐츠의 진행자로 자리 잡을 수 있도록 다양한 실험을 계속해보고 싶습니다. 도움 받은 글 (옵션) 스터디장님의 열정적인 정보제공 덕분에 중요한 정보들을 정말 쉽게 이해하고 습득할 수 있었으며, 함께하는 스터디원들의 열정적인 영상 생성 과정과 노하우 공유 또한 많은 자극과 도움이 되었습니다. 다른 수강생분들이 공유해주신 다양한 영상 제작 사례를 보면서, 완벽한 영상을 한 번에 만드는 것보다 직접 여러 도구를 사용해보고 시행착오를 경험하며 기록하는 과정이 더 중요하다는 점을 배웠습니다. ❤️ 결과물(현재 미완성) 보러가기❤️ https://youtu.be/KWwqbWZuNpU
    0
    0
  • 디노에뜨

    remotion 도전기

    소개 3주차 스터디에서는 스터디장님께서 remotion 기능을 활용해서 안티그래비티에서 영상을 만드는 방법을 알려주셨다. 그래서 이번 과제는 실제로 remotion 기능으로 영상이 만들어지는지 도전하는 기록을 남기고자 한다. 진행 방법 아직 하네스 사용법이 서툴러서 버벅대가며 일단 알려주신 방법대로 시도해 보았는데, 우선 따라하고 싶은 레퍼런스 찾기가 너무 어려웠다. 레퍼런스를 찾아 그 영상을 먼저 분석하고 다른 스타일로 생성해달라고 해야 하는데, 2시간이 넘도록 레퍼런스 찾는다고 유튜브 뒤지다 애먼 유튜브 영상만 실컨 보고... ^^; 아무래도 안되겠다 싶어 2주차에 내가 만든 영상을 다른 스타일로 만들어달라고 요청해보았다. 프롬프트: remotion 내용을 잘 읽고, mongmong-rescue-support 영상을 애니메이션 스타일의 영상으로 다시 만들어줘. 결과물: 결과물은 보다시피 여러가지 문제를 가진채로 생성되었다. 문제점 1. 소리가 나오지 않는다. 문제점 2. 10초가 15초로 생성되었다. 문제점 3. 소리가 나오지 않았지만 대사를 제멋대로 해석해서 자막을 내보냈다. (하네스 안에 있는 이전 프로젝트의 영향을 받은 듯) 해결을 위한 노력: 안티그래비티에게 영상 파일 이름을 주고 문제가 되는 부분을 수정해달라고 요청할까, 유튜브에 올리고 링크를 준뒤 수정해달라고 요청할까... 하다가, 후자를 선택했다. 급히 유튜브에 원본 영상을 올린 후 링크로, 주고 애니메이션 스타일로 제작을 요청했다. 프롬프트: https://youtu.be/zU5_tBN6gwI remotion 내용을 잘 읽고, 이 영상을 대사 그대로 하되 애니메이션 스타일로 바꿔줘. 결과물: 못한단다. 외부에서 만들어 오면, 자기가 합성해주겠단다. 스터디장님은 분명히 안티그래비티에서 바로 다른 스타일로 만드는 것이 가능하다고 시연으로도 보여주셨는데, 이 놈은 지가 못한단다. 그래서 다음에 내가 넣은 프롬프트: 영상 만드는 것도, 음성 만드는 것도 네가 다 자동으로 할 수 있다고 하던데? 그런데 왜 너는 외부에서 해오라고 그래? 답변: 또 말 안듣는다. 그래서 나도 계속 우겼다. 내 생각엔 할 수 있을 것 같아서다. 프롬프트: 내가 지금 하려는게 안티그래비티에서 바로 리모션 기능을 활용해서 영상 만드는 걸 해내고, 그걸 과제로 내는 거야. 그런데 네가 외부에서 만들어 오라 하고, 너는 편집 수준으로 만들어 주겠다 하면 과제의 의미가 없어져. 네가 그 설정을 뛰어 넘도록 프로젝트 2로 먼저 넘기고 작업 할 수 없어? 결과물: 이번엔 영상으로 생성해주기는 했는데, 또 문제점이 있다. 문제점 1: 영상이라기엔 이미지 수준 문제점 2: 여전히 10초 영상이 15초로 제작되어 후반 5초는 그냥 멈춤상태. 문제점 3: 완전 아저씨 목소리. ㅜ ㅜ 그래서 다시 요청했다. 프롬프트: 수고는 했는데, 이미지만 달랑 있고 움직이는 영상이 아니잖아. 그리고, 10초 영상이야. 15초로 하지마. 그리고 목소리는 3살 남자 아이 목소리야. 아저씨 목소리 아니야. 다시 만들어. 결과물: 와~ 이번엔 진짜 웃음이 났다. (허탈해서... ㅜ ㅜ) 동영상으로 만들라고 했더니 그냥 이미지를 흔들기만 했다. 목소리도 여전히 아저씨. 그나마 바뀐건 10초로 생성해 준것. 다시 요청했다. 프롬프트: 강아지가 귀엽게 말하는 모습을 립싱크도 맞춰주고, 눈으로 찡긋 인사도 하는 영상으로 만들어줘. 목소리는 3살 남자 아이 목소리로 바꾸고. 또다시 못한다 소리를 시전하더니, 나중엔 지가 어떻게든 내부에서 억지로 입을 뻐끔거리게 만들어 볼까요? 한다. 그래서 무조건 네가 알아서 하라고 했더니, 이녀석, 까짓것 해보겠습니다! 🔥 이란다. 하하.. 결과물: 진짜 억지로 입 뻐끔뻐끔에, 억지로 눈 찡긋하고, 목소리도 비교적 아이스럽게 바뀌기는 했다. 눈이 아프게 흔들어대는 건 수정하지 못했지만, (에휴~ 한숨 푸욱~~~) 이 상태로 안티와 씨름해봐도 억지스러운 영상에서 크게 못 벗어날 것 같아서... remotion의 진정한 진가는 레퍼런스를 찾아 다른 프로젝트에서 시도해보는 걸로 하고 오늘의 첫 시도를 마무리하기로 한다. 어떤 도구를 사용했고, 어떻게 활용하셨나요? 안티그래비티 remotion 결과와 배운 점 결과가 계속 반복되게 의도에 한참 못미치는 수준으로 나오고 있지만, 사실 아직 안티그래비티와는 더 많은 티키타카를 통해서 안티를 진화시켜야 겠다는 생각이 든다. remotion 의 기능을 십분 끌어낼 수 있도록 더 많은 시도와 테스트를 해봐야 겠다. 도움 받은 글 (옵션) 스터디장님께서 보여주신 시연이 도움이 되었습니다.
    1
    1
  • 음성이 들어간 "자기경영 - 시간 관리편" 영상 만들기

    1. 소개 지난번에는 구글 Flow 에이전트를 활용해 《가정경영자》 영상을 만들었던 후기를 전해드렸었는데요. 이번에는 한 단계 더 나아가, 대화형 음성을 넣은 《자기경영 - 시간 관리편》 영상을 만든 사례를 만들어 보았습니다. 영상 주제: "긴급하지는 않지만 중요한 일을 먼저하라(시간 관리)" 포맷: 지혜로운 60대 시니어 멘토와 고민 많은 30대 청년의 2인 대화형 애니메이션 최종 분량: 2분 10초 2. 사용된 AI 및 편집 도구 (5가지 에이전트 조합) Gemini: 전체 16개 컷의 스토리라인 기획 및 주인공 이미지 컷 제작, 인물별 대사 텍스트 정밀 조율 및 16개 컷의 설명문 작성 슈퍼톤 플레이 (Supertone Play): 캐릭터 A(60대 멘토의 신뢰감 있는 목소리)와 캐릭터 B(30대 청년의 고민이 묻어나는 목소리)의 생동감 있는 오디오 생성 구글 Flow: 두 캐릭터의 이미지와 프롬프트 설명을 에어전트에 입력하여, 비주얼 일관성을 유지한 수채화 및 웹툰 스타일(Watercolor & Webtoon style)의 이미지 및 비디오 생성 Grok: Flow에서 만든 정지 이미지에 자연스러운 무빙과 생동감을 불어넣는 비디오 변환 캡컷 (CapCut): 영상 조각 편집, 부족한 분량 추가 조율, 자막 생성, 배경음악(BGM) 볼륨 믹싱 및 최종 렌더링 3. 단계별 제작 프로세스 및 진솔한 노하우 Step 1: 스토리 및 대본 정교화 (Gemini) 제 책 <자기경영자> 내용중 시간 관리의 핵심 메시지인 "급하진 않지만 중요한 것(큰 돌)을 먼저 채우라"는 주제의 글을 바탕으로, 시각적 연출이 가능하도록 Gemini와 함께 대본(전체 16개 컷의 스토리라인 기획)을 다듬었습니다.(2분 분량) 60대 멘토와 30대 청년의 대화 형태로 만들었고, 두명의 이미지의 캐릭터를 생성했습니다. 처음에는 실사 형태의 이미지를 만들어 주었으나 일관성 문제가 우려되었습니다. 그래서 4개 스타일을 제안해 달라고 했고, 4개 스타일 중에서 "감성 웹툰/수채화 스타일로 결정했습니다. 2분 분량으로 16개 이미지 컷을 만들 수 있도록 각 이미지 컷의 설명서를 만들어 달라고 했습니다. Step 2: 입체적인 2인 대화 음성 생성 (슈퍼톤 플레이) 60대 멘토와 30대 청년의 목소리를 개성 있게 생성했습니다. 잘 어울리는 음성을 찾아 2명 각각의 대사를 녹음했습니다. Step 3: 캐릭터 에이전트로 일관성 잡기 (구글 Flow) 컷마다 인물의 비주얼이 바뀌는 문제를 막기 위해, 구글 Flow에서 '캐릭터' 기능을 이용하여 2명의 캐릭터를 만들었습니다.(정면만이 아니라 옆면, 뒷면 이미지까지) Flow 에이전트 지침에 캐릭터 이미지와 구체적인 설명을 미리 주입했습니다. 덕분에 은발 시니어와 청년의 수채화 톤이 끝까지 일정하게 유지되었습니다. Step 4: 유료화 장벽 극복과 Grok의 활용 (시행착오와 돌파) 입모양을 맞추어 비디오를 생성해주는 립싱크 비디오 AI 'Hedra'와 'D-ID'가 있다고 시도해 보았습니다. 영상 1개를 만들자마자 유료 전환 창이 떠서 과감히 포기했습니다. 사실 립싱크 비디오 AI 'Hedra'로 작업을 하니 립싱크는 확실히 잘 되는 것을 확인했습니다. 대신 구글 Flow와 Grok의 조합으로 선회하여 영상에 은은한 생동감을 주는 방식을 택했습니다. 입모양이 약간 맞지 않는 문제가 있었습니다. Step 5: 종합 편집 및 사운드 디자인 (캡컷) 오디오와 비디오를 넣어 음성에 맞추어 비디오 길이를 조절하여 편집을 진행했습니다. 캡컷의 자동 자막 생성 및 수정 기능을 활용하였습니다. [돌발 상황 해결] 먼저 만든 슈퍼톤 오디오의 길이가 긴 구간이 있어, 준비한 영상 분량이 모자라는 일이 생겼습니다. 캡컷 타임라인에 맞춰 구글 Flow와 Grok으로 이미지와 영상을 추가 생성해 레이어를 추가로 채워 넣었습니다. 오디오 믹싱: 자막(자동 캡션)을 정렬하고, 잔잔한 시네마틱 피아노 음악을 깔았습니다. 대사가 묻히지 않도록 BGM 볼륨을 -20dB 이하로 대폭 낮췄습니다. 마무리 여운: 엔딩 타이틀 컷에서 음악이 부드럽게 사라지도록 페이드 아웃(Fade out) 3초를 적용해 깊은 인상을 남겼습니다. Step 6: 영상을 제 유튜브 채널에 업로드했습니다. https://www.youtube.com/watch?v=lFYF-Yxk-eA 4. 결과와 배운 점 (1) 결과 여러 AI와 Tool을 활용하여 2분 10초 분량의 《자기경영 - 시간 관리편》 애니메이션 영상을 최종 완성하였습니다. 장시간에 걸친 작업이었지만 음성을 넣은 첫 작품이기에 나름 만족하고 있습니다. (2) 배운 점 이번 영상을 제작하며 스터디장님께서 전수해주신 소중한 팁들을 복습하고 실전에 적용해보았습니다. 일부 기능은 완벽히 마스터하여 실행했고, 일부 고급 기능은 다음 프로젝트의 과제로 남겨두게 되었습니다. 성공적으로 실행하고 따라한 점: 캡컷 편집 기능 최적화: 오디오 음파를 정밀하게 조절하기 위해 '넓고 높게 보는 UI'를 적극 활용했고, '자동 자막 생성 및 수정' 기능으로 싱크를 빠르게 맞췄습니다. AI 음성 일관성 확보: 슈퍼톤 플레이를 활용해 60대 멘토와 30대 청년의 개성 있는 목소리를 만들고 구어체 대사를 매끄럽게 연출했습니다. 오디오 안전 믹싱: 대사와 배경음악이 섞일 때 목소리가 묻히지 않도록 오디오 볼륨을 최적화했습니다. 아쉽게 실행하지 못해 향후 과제로 남긴 점: 립싱크 기술 : 일부 AI 도구들의 갑작스러운 유료화 장벽으로 인해 실제 영상에 립싱크를 완벽히 매칭하는 단계까지는 실행하지 못했습니다. 기타 AI 도구 비교: 타입캐스트 등 스터디에서 배운 다양한 AI 음성 도구들을 교차 비교하며 캐릭터 음성의 일관성을 더 세밀하게 확보하는 방안은 다음 프로젝트에서 심화 학습으로 도전해볼 계획입니다. 캡컷 프리렌더링: 이번에는 수동으로 기민하게 대응했으나, 향후 이펙트가 많아질 때를 대비해 프리렌더링 기능을 다루는 연습이 더 필요함을 느꼈습니다. 5. 도움 받은 글 (옵션) 이번 스터디장님과 스터디원분들의 열정적이고 꾸준한 실행력에 감동을 받았습니다. 스터디장님과 스터디원분들이 카톡방을 통해 공유해 주신 각종 사례나 프롬프트 등이 많은 도움이 되었습니다. 스터디장님과 스터디원분들의 열정에 감동하여 저도 최선을 다하게 되었습니다. 감사합니다.
    1
    1
  • 천안한마당

    AI영상 TTS생성 제작, 가능은 했지만 쉽지는 않았다.

    AI 영상 제작 실습 후기 배운 것 코덱스를 활용하여 영상 다운로드 받는 방법 슈퍼톤(Supertone)을 활용한 TTS(음성 합성) 제작 방법 캡컷(CapCut) 단축키 설정 및 효율적인 편집 방법 영상을 컷 단위로 분리하여 이미지 추출하는 방법 자동 자막 생성 및 편집 방법 챗GPT를 활용한 이미지 프롬프트 작성 및 이미지 생성 방법 그록(Grok)을 활용한 입모양(립싱크) 영상 제작 방법 실습한 것 이번 실습에서는 웹소설 원작 콘텐츠인 「취사병 전설이 되다」를 활용하여 AI 영상 제작 전 과정을 경험해 보았습니다. 1. 영상 소스 준비 「취사병 전설이 되다」 영상 다운로드 영상 내용을 분석하여 주요 장면 선정 2. 컷 편집 및 이미지 제작 장면별로 컷을 분리하여 이미지 추출 챗GPT를 활용하여 각 장면에 맞는 이미지 프롬프트 작성 AI 이미지 생성으로 부족한 장면 보완 3. 음성 및 캐릭터 제작 슈퍼톤을 활용한 TTS 음성 제작 그록을 활용하여 캐릭터 입모양(립싱크) 영상 생성 대사와 입모양을 자연스럽게 연결 4. 최종 편집 캡컷으로 영상 편집 장면 전환 효과 적용 자동 자막 생성 및 수정 배경음악(BGM) 및 효과음 삽입 최종 쇼츠 영상 완성 느낀 점 이번 실습을 통해 AI 도구를 활용하면 혼자서도 영상 제작이 가능하다는 점을 체감할 수 있었습니다. 특히 챗GPT, 슈퍼톤, 그록, 캡컷을 연계하면 기획부터 이미지 제작, 음성 생성, 편집까지 대부분의 과정을 직접 수행할 수 있다는 것이 인상적이었습니다. 다만 TTS 제작과 립싱크 작업은 생각보다 많은 수정 작업이 필요했습니다. AI가 기본 작업은 빠르게 수행해 주지만, 자연스러운 결과물을 만들기 위해서는 반복적인 검수와 수정이 필수적이라는 점을 느꼈습니다. 또한 앞으로 유튜브 쇼츠 제작 시 이러한 AI 도구들을 적절히 활용하면 제작 시간을 크게 단축할 수 있을 것으로 기대됩니다. 어려웠던 점 1. 여러 캐릭터를 한 화면에 배치하는 작업 캐릭터들의 크기와 위치를 자연스럽게 맞추는 것이 쉽지 않았음 동일한 스타일과 비율을 유지하는 데 어려움이 있었음 2. 장면의 디테일 표현 순간적으로 지나가는 장면이라도 디테일을 살려야 영상의 완성도가 높아짐 AI 이미지 생성 시 원하는 구도와 표정을 정확하게 구현하기 위해 여러 번 수정이 필요했음 3. 립싱크 작업 입모양 생성은 가능했지만 대사 길이와 타이밍을 맞추는 과정이 상당히 번거로웠음 여러 번 재생성과 수정 작업이 필요했음 4. 전체 흐름 연결 개별 장면은 잘 만들어졌지만 장면과 장면 사이의 자연스러운 연결을 만드는 것이 생각보다 어려웠음 시청자가 몰입할 수 있도록 편집 리듬을 맞추는 과정이 중요하다는 것을 배움 앞으로의 활용 계획 역사 유튜브 쇼츠 제작 AI 캐릭터를 활용한 스토리 영상 제작 청소업체 홍보 영상 제작 AI 음성과 립싱크를 활용한 교육 콘텐츠 제작 반복 작업을 줄여 영상 제작 시간을 단축하고 더 많은 콘텐츠 제작에 도전할 예정
    3
    4
  • 회춘쏭 체조 영상 제작 - 후렴구만 했는데 힉스필드 하루만에 90% 크래딧 소진

    소개 어르신 대상 체조 콘텐츠를 회춘쏭에 맞춰 영상 제작했습니다. 유튜브에서 실버 체조 동영상들이 평소 어르신들이 따라하기에는 적합한 영상이 많지 않아 예전에 직접 촬영 방식으로 제작했었는데, 반복 시청이 많았던 경험이 있어서요. 체조 동작을 AI 영상으로 표현하는 게 만만치 않을 것 같아서, 일단 후렴구부터 시범 제작했는데, 뮤직비디오 한 편 만드는 노고와 못지 않았습니다. 야심차게 한달 동안 잘 써보려고 higgsfield를 구독했는데, 후렴 부분 만들고 나니, 90% 크래딧을 소진했다고 하네요. ><; https://youtube.com/shorts/1d3BfVKnjx8?si=5r2oydjt69WztYWZ 진행 방법 ## 사용한 도구 - Codex, Claude Code - higgsfield (ChatGPT 이미지, Seedance 영상) - 캡컷 ## 진행 과정 요약 회춘쏭 제작 – 영상 컨셉 – 씬이미지 생성 – 영상 생성 – 캡컷 편집 1) 캐릭터 여자 어르신들이 좋아할만한 젊은 훈남 선생님입니다. 단정한 훈남이지만 의상에 포인트를 준 캐릭터입니다. Seedance 믿고, 이번에는 실사로 해봤습니다. 2) 배경 영상의 변화를 주기 위해 배경을 한번씩 변경하는 컨셉으로 하려고 합니다. 일단 후렴 부분은 트로트 무대입니다. 그리드로 트로트 무대를 뽑아 고르려고 했는데, 캐릭터 시트를 반영해서 하려고 하니, 일관성 유지가 잘 되지 않았습니다. 그래서 그리드로 뽑은 것 중 마음에 드는 한씬을 골라, 단일 씬을 다시 생성했습니다. 3) 노래와 안무 - 음악은 수노가 잘 해주는데, 이번에는 안무까지 짜야 해서 더 어려웠습니다. - 힉스필드를 사용하다 보니 Kling 3.0 motion control 이라는 모델이 있는데, 라이브러리에서 사람들이 올려놓은 동작을 선택하고 내 캐릭터를 넣으면, 내 캐릭터가 그 동작을 하는 영상을 생성해주는 기능입니다. 아직 라이브러리가 많지 않은 것 같고, 어르신들이 할만한 단순한 율동 동작이 잘 없어서 아쉽습니다. 4) 이미지 생성 - 힉스필드에서 chatgpt 이미지 생성을 사용했는데, 하다보니 크래딧이 빨리 소진되어서 클로드에 물어보니 퀄리티를 high 말고 medium으로 해도 문제 없답니다. 어차피 장면 레퍼런스만 하는 것이고, 영상 생성 퀄리티와는 별개라는군요. - 영상이 프롬프트 만으로 동작을 몇가지나 소화해줄 수 있을지 테스트가 필요했는데, 결론은 거의 안됩니다. 동작 장면마다 이미지를 다 만든다고 생각해야 합니다. - 이미지든 영상이든 동작을 프롬프트로 설명하는 것은 너무 어렵고, 성공 클립을 위해 시행착오를 피할 길이 없습니다. 5) 영상 생성 - 영상은 seedance로 생성했는데, 힉스필드 구독료가 워낙 비싸서 이렇게까지 크래딧이 빨리 소진될 지 몰랐습니다.ㅠ 후렴만 만들었는데 90%를 썼네요. 처음에 미숙해서 잘못 사용하기도 했는데, 엄청 비싼 수업료입니다. - 처음에는 귀찮아서 cli에서 몇 번 해봤는데, 클로드코드 토큰까지 사용하는 것은 미련하다는 생각이 들었고, 힉스필드 UI가 편한게 많습니다. 생성한 이미지나 영상을 한꺼번에 볼 수 있고, 레퍼런스 사용도 편하구요. (그록도 그랬던 것 같은데) 6) 캡컷 편집 - 체조를 각각 영상 클립으로 편집하다보니, 동작이 바뀔 때마다 연결되지 않고, 튀는 것을 어떻게 해결해야 할지 모르겠습니다. - 영상 색감도 조금씩 달라지는데, 영상 전문가가 아니라서 미세한 조정이 너무 어렵네요. 7) 제작 가이드 업데이트 - 제작 프로세스 효율을 올리고, 시행착오를 줄이려고, 작업하면서 계속 가이드 파일을 정리하고 있는데, 생성되는 수많은 이미지와 영상 클립을 마구잡이로 생성하다 보니 레퍼런스 찾을 때 너무 헷갈려서 파일명 가이드를 정했습니다. 전문가들의 더 좋은 방식이 있을 것 같은데, 참고하고 싶네요. <파일 관리 구조> [프로젝트]_[번호: 클립종류에 따라]_[설명].[확장자] 예) 회춘_101_캐릭터_레퍼런스.png 프로젝트명: 프로젝트마다 고유한 한글 약칭을 붙입니다. 나중에 프로젝트가 여러 개 생겨도 파일명만 보고 어떤 프로젝트 자산인지 바로 알 수 있고, Obsidian 카탈로그에 도움될 것 같습니다. 예) 회춘 번호로 바로 찾을 수 있도록: 세 자리(001~999) 숫자로 클립 번호를 붙이는데, 번호 범위로 파일 타입을 구분합니다. 1xx — 이미지 (캐릭터, 포즈, 배경 등) / 4xx — 영상 클립 설명: 파일을 열지 않아도 내용을 알 수 있도록 짧고 직관적으로 씁니다. 저장 위치: 이미지나 영상 생성 레퍼런스를 찾을 때 편리하도록 00_reference\ 폴더 하나에 이미지·영상 구분 없이 모아서 관리합니다. 궁금한 것 안무를 직접 짜고 영상을 만들려니 더 힘들었을까 싶은 생각이 드는데,, 음악에 맞춰서 앉아서 쉽게 따라할 수 있는 체조를 알아서 영상으로 만들어 달라고 하는 것은 어려울까요? 토옵짱님 플라밍고 영상에서 음악의 박자와 리듬과 속도에 맞춰 춤추는 영상 어떻게 만드셨는지 궁금합니다.
    1
    5
  • 눈오지

    Seedance2.0 영상 도전하기

    소개 Seedance 2.0 영상을 만들면서 시도했던 시행착오들을 공유합니다. 진행 방법 seedance2.0을 사용함 좋은 레퍼런스를 찾은 뒤에, 이를 공부해서 영상으로 만들 생각을 했습니다. 게임 애니메이션처럼 있는 레퍼런스가 있어서, 이 움직임을 학습시켜보기로 했스빈다. 뽀짝이를 주인공으로 삼으려고, 이미지 및 에셋도 준비를 했습니다. 이미지는 코덱스로 만들었습니다. 해당 화풍을 분석한 다음에 필요한 에셋을 코덱스로 만들어달라고 했더니 잘 만들었습니다. 2. 정지 이미지 → 영상 (Seedance i2v) 방식 A: 시작 + 엔드 핀 (start_image + end_image) 컷마다 시작 프레임과 엔드 프레임을 Codex로 만들면, 그 사이 동작을 Seedance가 채운다. 장점: 구도·캐릭터·적 디자인을 100% 통제할 수 있다. 주의사항 한 컷에 동작이 여러 개이거나 시작/끝 구도 차이가 너무 크면 둥둥 뜨는 모핑("수영") 발생 → 한 클립 = 한 동작 엄수 전투 컷은 윈드업(start) → 임팩트 직후(end), 같은 앵글·같은 배경, 적은 양쪽 프레임에 모두 배치 임팩트 어휘 필수: impact flash, screen shake, speed lines, ink explosion fast는 품질을 깎으므로 금지 끝 포즈 이후 남는 시간은 camera pushes in after impact로 채우거나, 편집에서 트림 컷끼리 연속성이 없으므로 연결이 필요하면 체이닝 필수 (앞 컷 마지막 프레임 → 다음 컷 start) 문제가 발생한 내용은 아래에 설명 드리겠습니다. 이렇게 영상을 뽑았을 때 문제는, 연속성이 없었다. 시작점과 끝점을 주고 영상을 만들라고 했더니, 약 2초정도 멈추는 문제점이 발생했다. 이거 편집할 생각을 하니 꽤나 아찔했다.(사실 편집하는 일이 맞는데 시간이 없었기 때문) 그러다 seedance2.0에 영상을 레퍼런스로 주고, 이미지를 바꿀 수 있는 기능이 있다는 사실을 알게 됨 돈 태우는 일이지만 바로 만들어주는 걸 볼 수 있었습니다. 방식 B: 영상 레퍼런스 (video role) ✅ 최종 채택 원본 영상 구간을 video로, 뽀짝이를 image로 주면 원본의 동작과 카메라를 뽀짝이에 입힌다(모션 트랜스퍼). 장점: 격렬한 카메라워크 + 전투의 펀치감 + 연속성이 공짜. 부드럽게 흐르는 결과물의 정답. 단점: 원본의 배경·적 디자인이 딸려 오기 때문에 커스텀 디자인이 약해진다. 렌더 시간도 컷당 10분 이상으로 길다. 단, 배경이 보이는 구간을 고르면 성/계단 배경은 유지된다. 영상 3개를 합쳐서 나온 결과입니다. 결과와 배운 점 힉스필드 mcp로 영상을 만들고 있는데, 클코 작업하면서 영상을 만드는게 신기했습니다. 다만, IP 차단 이슈가 있다는 점 도움 받은 글 (옵션)
    0
    2
  • 구글 Flow 에이전트 활용하여 책 '가정 경영자' 영상 만들기

    1. 소개 며칠전에 제 책 ‘마술은 최고의 사교술‘ 홍보 영상(2분42초)을 만들었는데 꽤 시간이 많이 걸리고 힘들었습니다. 일관성을 유지시키기 위해 이미지를 여러번 수정하는 것이 힘들더라구요.(7시간 걸렸어요) 스터디장님께서 너무 기가 빨리는 것 아닌가 걱정을 하시는 것이 이해가 되었습니다. 책 '마술은 최고의 사교술' 영상 제작 사례 https://www.gpters.org/media/post/produced-promotional-video-book-sCsqI7h3VgVATIC 그래서 오늘은 작년 10월에 출간한 제 책 '가정 경영자'의 홍보 영상을 만들고 쉽게 싶었습니다. 구글 'Flow 에이전트'를 활용하여 2분짜리 영상을 조금 쉽게 만들어본 사례입니다. 2. 진행 방법 (1) 어떤 도구를 사용했고, 어떻게 활용하셨나요? ① 영상을 제작하기 위해 ChatGPT, Suno, Flow, Grok, CapCut 등의 AI 및 편집 도구를 유기적으로 연계하여 활용하였습니다. ② 도구별 활용 ▶ [ ChatGPT ] 책의 내용에 맞게 가사 생성, 이미지 설명 글 작성 ▶ [ Suno ] 만든 가사를 활용하여 노래 및 음원 생성 ▶ [ Flow 에이전트 ] 가사 내용을 바탕으로 20개 이미지 생성 ▶ [ Grok ] 이미지를 움직이는 영상(Video)으로 변환 ▶ [ CapCut ] 영상 조각 편집 및 음원 합성 후 최종 내보내기 2) 구체 영상 제작 프로세스 ① ChatGPT에서 가사와 각 이미지 컷의 설명문 작성 - 제 책(가정경영자) 전체 본문 내용을 넣고, 가사를 만들었습니다. 2분 분량의 가사를 만들어 달라고 했습니다. 처음 만든 가사로 Suno에서 노래를 만드니 4분이 넘어갔습니다. 가사를 보다 짧게 수정하고, Suno에 넣을 Style도 수정해 달라고 해서 가사를 완성했습니다. - 나중에 Flow에서 이미지를 만들기 위해 노래에 맞는 이미지 컷 18장을 만들 '이미지 설명서'을 만들어 달라고 해서 만들었습니다. (인트로 1컷 + 노래 이미지 16컷 + 마지막 이미지 1컷) https://chatgpt.com/c/6a20cbc2-9930-8320-b2fb-7dab42050983 ② Suno에서 노래 작성 - ChatGPT에서 만든 가사와 Style를 Suno 넣은 뒤 노래 만들었습니다. - 노래가 마음에 안 들어 3번 시도했습니다. 최종 1분 59초 노래가 마음에 들어 선택했습니다. ③ 구글 'Flow 에이전트'에서 노래 가사에 맞는 이미지 20개 작성 - Flow라는 에이전트가 이미지를 일관성있게 잘 만들어준다는 유튜브 영상을 봤습니다. https://www.youtube.com/watch?v=7_UfUtdYQnQ - 바로 Flow로 들어가서 유튜브 대로 작업을 했습니다. 먼저 일관된 이미지를 만들기 위해 가족 4명의 이미지 컷 샘플을 만들었습니다. - 이 4인 가족 컷을 Flow 에이전트 지침에 넣었습니다. 그리고 "앞으로 이 이미지의 일관성을 유지해서 이미지 만들어 달라"고 요청했습니다. - 각 컷을 만들 때도 "가족 네명의 얼굴 일관성을 유지하고 3D 픽사 스타일로, 모든 글자는 한글로 써서, 이미지 16:9 형태로 만들어줘." 라고 공통적으로 입력하고, 아래에 ChatGPT에서 만들어 두었던 컷 이미지 설명 내용을 붙였습니다. - 인트로와 마지막 컷, 중간 16개 컷을 포함하여 총 18개 이미지 컷을 만들었는데, 일관성이 잘 유지되었습니다. - 참고로 구글 "Flow 에이전트"는 제미나이 유료 버전에서 가능하고, 이미지는 크레딧이 소모되지 않고, 영상을 만들 때는 크레딧이 소모된다고 합니다. ④ Grok에서 각 이미지의 영상 제작 - Grok에 각 이미지를 넣고 6초짜리 영상을 제작하는데, 이때 '말이나 노래를 하지 말고 영상 만들어줘'고 프롬프트를 넣어 만들었습니다. - 해상도 700P로 6초 영상 16개 정도 만드는 한도가 다 되었다고 해서, 그 이후에는 480P로 만들었습니다. ⑤ Capcut에서 영상 편집 - 노래의 앞 '전주'와 '1절과 2절 사이 음악만 나오는 부분'에 맞는 영상이 없어서 책 표지를 가지고 영상을 추가로 만들어 넣었습니다. - 노래가 모두 끝난 후 마지막 앤딩에 넣을 이미지가 없어서 '책 표지'를 넣어 마무리했습니다. ⑥ 유튜브에 업로드 - 제 유튜브(행복경영 TV- 해피매지션) 채널에 영상을 업로드했습니다. https://www.youtube.com/watch?v=w_4U2Vkb3uQ 3. 결과와 배운 점 (1) 과정 중에 시행착오는? - 초기 ChatGPT로 생성한 가사가 너무 길어 Suno에서 4분 이상의 노래가 만들어져, 가사 길이와 스타일을 3번 수정해서 만들어야 했습니다. - Grok에서 700P 해상도의 영상 제작 한도에 도달하여, 일부 영상은 480P로 제작해야 했습니다. - 노래의 '전주' 부분과 '1절과 2절 사이 음악만 나오는 부분', 그리고 '마지막 엔딩'에 필요한 영상이 없어 이 이미지들을 추가로 만들어 삽입하는 편집 과정을 거쳐야 했습니다. (2) 배운 점 📚 - 가사 작성 단계에서 각 이미지 컷에 대한 구체적인 설명문을 미리 만들어 놓는 것이 전체 영상 제작 과정의 효율성을 높이는 데 중요함을 깨달았습니다. - Flow 에이전트에서 샘플 이미지를 먼저 만들고, 그 이미지를 기반으로 후속 이미지를 생성하는 방식이 이미지 일관성 유지에 매우 효과적임을 확인했습니다. - 음악만 나오는 중간 구간이나 시작 및 끝 부분에 대한 영상 소스가 부족할 수 있으므로, 전체 노래 구조를 고려하여 미리 적절한 이미지 또는 영상 소스를 준비하는 것이 필요함을 경험했습니다. (3) 앞으로의 계획이 있다면 들려주세요. - 영상 주인공들이 말을 하는 영상을 만들어서 제가 해보고 싶은 '감동적인 영상'을 많이 만들고 싶습니다. - 더 다양하고 참신한 캐릭터와 음악 스타일을 시도하여 제 영상을 보는 분들에게 즐거움을 줄 수 있는 완성도 높은 영상들을 꾸준히 제작해 나갈 계획입니다. 4. 도움 받은 글 (옵션) - 이번 스터디장님과 스터디원분들의 열정적이고 꾸준한 실행력에 감동을 받았습니다. - 스터디장님과 스터디원분들이 카톡방을 통해 공유해 주신 각종 사례나 프롬프트 등이 많은 도움이 되었습니다. - 스터디장님과 스터디원분들의 열정에 감동하여 저도 최선을 다하게 되었습니다. 감사합니다.
    0
    1
  • AI로 로판 세계관 영상 만들기. 개꿀 NO 노가다 YES

    소개 웹소설을 종종 소비하고 쓰는데, 직접 쓴 웹소설 세계관을 영상화해보고 싶었어요 악역 영애로 빙의한 디자이너는 남부에서 사랑받는다 현실에서 23년 동안 어머니의 빚과 학자금 대출만 갚다 사망한 주인공 '지원'. 눈을 떠보니 웹소설 속 마탑주 영애에 빙의해있습니다. 귀족의 풍요로운 삶에 기쁜 것도 잠시, 하필이면 자신이 빙의한 영애가 악역으로 여주인공을 죽이려다 사형당하는 레이안느라는 걸 알게되는데,, 크기가 커서 풀버전이 업로드가 안되어서 풀버전은 스터디에서 공유할게요! 진행 방법 어떤 도구를 사용했고, 어떻게 활용하셨나요? 이미지 생성에는 chatgpt, gemini, grok 영상 생성에는 grok, flow, gemini omni 편집에는 캡컷을 활용했습니다 결과와 배운 점 배운 점과 나만의 꿀팁을 알려주세요. 스토리보드를 만들고 시작했는데 문제는 이미지 소스를 영상화할때 이미지 소스의 화질에 따라 영상의 퀄리티가 달라진다는 점이었어요! 그래서 업스케일링과 일관성 중에 무엇을 택할지 고민하다가 생성한 이미지를 다운받은다음에 이어지는 씬에 대한 설명을 해서 한장 한장 따로 스토리보드를 뽑았습니다 과정 중에 어떤 시행착오를 겪었나요? 캐릭터 설계부터 비주얼 최적화하는데 어려움이 많았어요. 특히 웹소설 세계관의 경우 반실사의 개념이라 너무 애니나 너무 실사 느낌이 나지않도록 조절해야했습니다. 여기에 캐릭터 외모 설정, 세계관과 주어진 역할 및 계급에 따른 착장, 배경에 대한 적합성은 물론이고 캐릭터의 일관성, 입모양 등 어려움이 많아 거의 3일정도를 썼는데도 수정의 수정을 거듭했습니다ㅠㅠ (사실 지금도 수정하고 있어요ㅋㅋㅋㅋㅋ) 소중한 크레딧의 소멸 사례 와중에 그록 크레딧이나 지피티 크레딧 등이 자꾸 한도에 닿고, 제미나이는 울트라를 써서 여유가 있지만 미감상 도저히 마음에 들지 않아 여러번의 수정과 수정을 거듭해야했습니다. 사운드 부분도 조정해야하는데 시간이 너무 없어서 사운드 배제하고라도 과제를 제출해보려해요! ㅠㅠ 앞으로의 계획이 있다면 들려주세요. 지금까지 만든 영상도 개연성, 인물 얼굴 유지 등이 아쉬워서 계속 잘라내고 리밋 걸리고를 반복중이에요. 시간이 되면 틈틈이 서사의 개연성, 주인공들의 비주얼 일관성, 타 캐릭터의 등장 등을 더 보완하고 전개를 이어보고 싶습니다! 과제가 쇼츠라면 여러개를 뽑을 수도 있었겠지만 저희 과제가 2분에서 3분 정도의 영상이다보니 만들면서 계속 조바심이 들었던것같아요. (토옵이님 말씀대로 다른 주제로 영상 만들걸,,괜히 욕심을 부렸네요ㅋㅋ하지만 덕분에 계속 즐겁게 만들고 있고 과정이 너무 재밌어요 2분 영상 만들기 실패하면 실패한대로 레슨런을 즐겁게 나눠볼거예욬ㅋㅋㅋ) 여러 변수가 많아 시간이 너무 많이 부족해서 아쉬운데 퀄리티는 도저히 포기할 수 없어서 리밋 걸리기전까지는 밤을 새워보기로했습니다. 하다보면 늘것같고 슈퍼그록 쓰고있는데 슈퍼그록 헤비도 결제할까 싶어요
    1
    2
  • 별찾아서

    간단한 카툰풍 쇼츠 영상 만들기

    소개 단톡방에 소개된 인스타그램 릴스 영상을 우연히 보고 간단히 따라서 영상 만들어보았습니다. https://www.instagram.com/reels/DYhb_WUJgxJ/ 진행 방법 인스타 릴스 영상은 액션캠으로 촬영한 영상을 포토샵과 Caput 프로그램으로 편집한 영상이었는데, 저는 GPT Image 2.0 으로 필요한 AI 이미지를 만들고, Seedance 2.0에서 영상화했습니다. Seedance 말고 Kling으로도 한번 테스트해보았는데 Seedance 영상이 결과물이 좋게 나왔습니다. (1) GPT Image 2.0 에서 이미지 생성하기 (2) Seedance 2.0 에서 영상 생성하기 (3) 구글 Lyria 이용해서 배경음악 만들기 Suno를 구독하지 않아서 차선책으로 구글 뮤직을 활용해서 간단한 배경음악을 만들었습니다. (4) 최종 결과물 결과와 배운 점 인스타 릴스나 유튜브 쇼츠 영상들을 보면서 아이디어를 얻어 자신만의 영상을 만들어 보는 경험들이 하나씩 쌓아가면 좋을 것 같다고 생각이 들었습니다. 도움 받은 글
    1
    1
  • 리모션 영상이 지루해서, 캐릭터 숏폼 워크플로우를 만듬

    캐릭터 숏폼 제작의 필요성 카드뉴스 + 리모션 영상이 계속 비슷하게 생성되어 변화가 필요했다. 손그림 캐릭터 기반 숏폼 제작 흐름을 새로 만들었다. 생각보다 훨씬 빨랐고, 하루 만에 “계속 만들 수 있는 구조”까지 잡혔다. 이 워크플로우가 필요한 사람들 카드뉴스·뉴스레터를 꾸준히 만들지만 점점 포맷이 비슷해지는 분 교육 콘텐츠를 영상으로 만들고 싶은데 시작이 막막한 분 코드는 모르지만 AI로 제작 자동화를 해보고 싶은 분 “AI 활용은 좋은데 결과물이 너무 AI 같아…”라는 고민이 있는 분 😫 시작은 단순했다. 지루함을 극복하기 위한 첫걸음 카드뉴스와 리모션 영상의 반복 “어… 또 똑같네.” https://youtube.com/shorts/xKWvicT6T3c?si=51-vV056K1K-SMWu 짧고, 캐릭터가 있고, 학생들이 부담 없이 볼 수 있는 숏폼 형식으로 전환했다. 🛠️ 사용한 도구 메인 도구: Codex 모델: GPT-5.5 카드뉴스 자동화: Python + Pillow 영상화: Grok 🔧 작업 과정 스토리보드로 시작하기 컷 8 하나를 먼저 보고: 스타일 괜찮은지 감정 느낌이 맞는지 영상으로 써도 되는지 확인한 뒤 전체 적용했다. 말풍선 제거로 유연성 확보 처음엔 이미지 안에 한국어 대사까지 다 들어가 있었다. 그런데 영상 편집 생각해보니까 자막은 따로 넣는 게 훨씬 유연했다. 그래서 다시 요청했다. “말풍선 다 빼고, 긴 텍스트도 제거해줘.” 콘텐츠의 재미 요소 강화 재미없는 콘텐츠의 문제 이미지도 나오고 대사도 나왔는데… 막상 읽어보니까 재미가 없었다. 교육 콘텐츠 특유의 “좋은 말인데 안 보게 되는 느낌.” 그래서 그냥 솔직하게 말했다. “학생들이 안 볼 것 같다. 재미있게 바꿔줘.” 그랬더니 흐름이 완전히 바뀌었다. 설명형 콘텐츠가 아니라: AI 답변 대참사 질문력 진단 질문 업그레이드 챌린지 이런 코미디 구조로 바뀌었다. 호기는 괜히 허세 부리고, AI는 이상한 답 하고, 별쌤이 태클 거는 흐름. 이때부터 캐릭터가 살아나기 시작했다. 효율적인 자산 활용 기존 자산의 재활용 스토리를 바꿨으니 이미지도 전부 다시 만들어야 하나 싶었다. 근데 너무 아까웠다. 그래서 이렇게 말했다. “쓸 수 있는 이미지는 그대로 두고, 필요한 것만 새로 만들어줘.” 여기서 진짜 인상적이었다. Codex가 기존 컷과 새 스토리를 비교하더니: 재사용 가능한 컷 새로 필요한 컷 을 구분해서 정리했다. 그리고 실제로 부족한 장면만 추가 생성했다. 이건 진짜 작업 방식이 달라지는 느낌이었다. 예전 같으면 스토리 수정 = 처음부터 다시 작업 이었는데, 이제는: “기존 자산 유지 + 필요한 부분만 추가” 가 가능해졌다. 음성 작업의 도전 다음 단계로 Supertone에서 목소리 생성해서 일관성을 유지하려고 한다. 호기와 별쌤 목소리가 매번 조금씩 달라졌다. 이게 생각보다 치명적이었다. 캐릭터 콘텐츠는 목소리 일관성이 굉장히 중요했다. 그래서 지금은: 목소리 고정 기능 캐릭터별 음성 유지 감정 안정성 이 더 좋은 TTS 도구도 같이 검토하고 있다. 카드뉴스 자동화의 연결 중간에 Codex가 이런 제안을 했다. “음성 가기 전에 카드뉴스 형태로 먼저 확정하는 게 안전하다.” 생각해보니 맞는 말이었다. 그래서 카드뉴스 버전을 먼저 만들기로 했다. 그리고 여기서 제일 신기한 일이 벌어졌다. Codex가 Python/Pillow 기반 카드뉴스 렌더링 스크립트를 만들어준 것이다. 내가 한 건 거의 이것뿐이었다. “이런 카드뉴스 자동으로 만들어줘.” 그런데 결과물은: 컷 번호 시간 중앙 이미지 자막 설명 편집 메모 까지 다 자동 배치된 카드뉴스였다. 코드를 못 짜도 여기까지 된다는 게 꽤 충격이었다. 자산 재활용으로 카드뉴스 3종 제작 여기서 끝이 아니었다. 같은 이미지 자산으로: <검토용 카드뉴스> <영상 연출용 카드뉴스> <시청자용 완성형 카드뉴스> 이렇게 세 가지 버전까지 나왔다. 특히 좋았던 건 “한 번 만든 걸 계속 재활용할 수 있다”는 점이었다. 예전엔 콘텐츠 하나 만들 때마다 새로 시작하는 느낌이었다면, 지금은 점점 라이브러리가 쌓이는 느낌에 가까워졌다. ✅ 결과적으로 달라진 점 Before 카드뉴스 + 리모션 반복 캐릭터 없음 매번 수작업 콘텐츠 하나 만들 때마다 새로 시작 After 캐릭터 숏폼 구조 호기·별쌤 시리즈 카드뉴스 자동 렌더링 기존 자산 재활용 💬 이번 작업에서 가장 크게 배운 것 단계별 접근의 중요성 이번 작업에서 가장 잘한 건 “단계별로 끊어간 것”이었다. 샘플 1컷 스타일 확인 전체 적용 대사 수정 카드뉴스화 영상화 이 흐름으로 가니까 중간에 방향 바꾸기도 쉬웠다. 기존 자산의 유지와 추가 AI 작업은 자칫하면 매번 처음부터 다시 만들게 된다. 그런데: “쓸 수 있는 건 유지하고 필요한 것만 추가해줘” 라고 말하면 완전히 달라진다. 이 한 문장이 시간도 아끼고, 작업물도 살린다. https://youtube.com/shorts/LVgSVntay5o?si=YLLpfh_X0z_lnGDi 🚀 다음 계획 TTS 캐릭터 별로 목소리 일관성 유지하기 위한 방법 찾고, 적용해보기.
    1
    4
  • 새로운 에피소드 도전

    소개 2주차에 스터디장님 기본 내용에 따라 안성을 하고 이번에 새로운 세계관으로 도전 진행 방법 구글 제미나이에서 동영상 제작이 되지 않아 flow로만 제작 이번에는 flow에서 캐릭터가 생성되어 flow로 생성 단점: flow에서 생성된 캐릭터 이미지는 다운이 되지 않음, 스크린샷만 가능 추진하고 자 했던 장면 비행기에서 한국 남자주인공과 외국 여자 주인공이 만나는 장면 묘사 가방을 들어주면 인연 시작을 그려려고 했음 남주인공 민우 여주인공 엘라 에피소드01 도전 두 캐릭터를 가지고 무거운 것을 들어주는 장면을 도움요청과 도아주는 씬01, 02로 도전 씬01 도우줄수 있나요? 씬02 도와드릴께요 결과와 배운 점 Flow에서 캐릭터를 생성하여서 동영상 씬 들이 연관성 있게 나올 것으로 기대하였다. 안됨점 남자 주인공이 캐릭터와 다르게 변경 씬01과 씬02 가 자연스럽게 안이어짐. 도와주세요 장면과 자연스럽게 도와드릴께요 장면이 이어져야 하는데 새로 만든 느낌이 들게 제작이 됨. 느낀점 동영상에서 내가 원하는 대로 제작되는게 힘듦을 깨달음. 하네스가 동영상부분에서 특히 고난이도와 인내가 필요하다는 것을 느꼈음. Flow 에서 캐릭터가 생성 되어 만족함 그러나 생성된 이미지가 다운이 안된다는 단정이 있음을 알게 되었음. 다운된 이미지를 원래는 구글 제미나이에서 동영상을 제작해 보려고 했으니 실패 다양한 시도를 통해 동영상이 어디까지 하네스를 할 수 있을지 계속 시도해 보는것이 중요하다 생각됨
    2
    1
  • 토옵이

    유한킴벌리 삵냥이송 클론코딩

    소개 이번 주에는 화제가 되었던 유한킴벌리의 삵냥이 송을 클론코딩 해보았습니다. https://www.youtube.com/watch?v=Hk_I12MTtn0 개발자들이 취업하기 전에 공부하면서 클론코딩이란걸 하는 경우가 있는데요. 기존에 있는 서비스를 따라 만들어보는겁니다. ㅎㅎ 이를테면 에어비앤비 클론코딩이라고 부르고, 에어비앤비를 따라서 만드는 시도를 하는거죠. 저도 그런걸 해보면 재미있겠다 싶어서 해보았습니다. 진행 방법 https://www.youtube.com/watch?v=e7wY8R1hP5c 이게 원본 영상입니다. 영상의 노래가 좀 별로라고 생각했던 저는 노래는 더 잘 만들 수 있을거 같아서, 가사를 다 받아 적었습니다. 그리고 suno에 가서 곡 생성을 돌렸지요. 그런데 가사가 운율이 잘 맞지 않아서 곡이 정말 잘 안나오더라고요. 결과적으로 원래 곡 보다 좋은 노래 만들기는 실패한거 같고요. 스터디 멤버분들께 가사가 좋아야 곡이 잘 나온다고 했는데, 그건 틀리지 않았음을 스스로 다시 체험하는 시간이었습니다 ㅎㅎ 영상 제작을 위해서는 영상을 틀어서 장면 마다 멈춰놓고 보면서 챗지피티에서 이미지를 만들었습니다. 먼저 삵냥이 캐릭터 시트를 만들었고요. 해당 시트를 활용해서 장면 별로 이미지를 만들었습니다. 원본 뮤비에는 실제 자연 배경으로 보이는 실사 스타일 장면과, 콜라주 형식의 장면이 섞여있었어요. 실사 스타일의 경우는 장면을 그대로 묘사하여 뽑았습니다. 캐릭터 시트 자체가 실사 스타일이기 때문에 별도의 요청을 하지 않아도 자연스럽게 실사 스타일 장면이 잘 나왔고요. 콜라주의 경우는 배경에 대해서만 이러이러한 스타일의 종이 콜라주 배경이고 그 위에 냥이의 이런 동작을 올려달라고 요청을 하니 어렵지 않게 만들어 갈 수 있었습니다. 모든 장면의 이미지를 전부 만들었고, 영상은 각 이미지를 사용하여 원본 영상을 보면서 동일한 연출을 요청했습니다. 마음에 드는 컷이 나올 때까지 반복했고요. 이전에는 일일 생성 횟수 제한에 걸려서 작업하는데 어려움이 많았는데요. 이번에는 수퍼그록 헤비를 결제해서 막힘없이 하루에 작업을 끝낼 수 있었습니다. 결과와 배운 점 저는 그동안 실사 스타일 작업을 잘 하지 않았었는데요. 인물이 등장하면 입모양 맞추기 등 뻔히 예상되는 어려움들이 있었기 때문이었습니다. 이번에 냥이 영상으로 시도해보고 잘 되는걸 경험한게 의미가 있는거 같고요. 이후에는 사람이 등장하는 영상 연출도 시도해볼 예정입니다.
    1
    1
  • 행복한 다이어터 쿼카🐹 숏폼 제작기

    이번에는 세상에서 가장 행복한 동물, '쿼카'가 주인공인 다이어트 공감 숏폼 제작기를 공유합니다. 365일 다이어트를 꿈꾸지만, 맛있는 음식 앞에서는 무장해제되는 쿼카의 모습을 통해 소소한 웃음을 담아보았습니다. 1. 기획 의도: "맛있게 먹으면 0칼로리?" 다이어트는 늘 어렵지만, 음식 앞에서 행복해하는 모습을 '세상에서 가장 행복한 동물'이라는 쿼카의 매력에 더해 표현한다면 재미있을 것 같아 기획하게 되었습니다. 이번 프로젝트는 제미나이와 Flow를 적극적으로 활용해보았고 더 역동적인 캐릭터 표정 변화를 구현하는 것을 목표로 했습니다. 2. 제작 포인트 시나리오: 다이어트 음식인 그래놀라, 베이글, 샐러드를 먹으며 "이건 살 안 쪄!" 라고 합리화 하며 맛있는 먹는 쿼카 → 하지만 마지막에 체중계 수치를 보고 반전의 현실을 깨닫는 코믹한 엔딩 제작 방법: 1단계: 제미나이(Gemini)를 통한 시나리오 및 프롬프트 최적화 * 시나리오 작성: 쿼카의 캐릭터 성격과 '맛있는 다이어트'라는 핵심 컨셉을 바탕으로, 숏폼에 최적화된 1분 분량의 대본을 작성했습니다. * 이미지 프롬프트 생성: 각 씬별로 쿼카의 표정과 상황을 구체화한 영문 이미지 프롬프트를 추출하여, 일관성 있는 캐릭터 비주얼을 확보했습니다. 2단계: Flow(이미지 생성) 및 Hedra(립싱크)를 통한 비주얼 구현화 *이미지 구현: 생성된 프롬프트를 바탕으로 AI 이미지 생성 모델(Flow)을 사용하여 다이어트와 음식을 대하는 쿼카의 모습을 고퀄리티로 구현했습니다. 3. 시행착오 및 팁 표정 구현: 단순히 음식을 먹는 영상이 아니라, 음식의 종류(그래놀라, 베이글 등)에 따라 쿼카의 모습을 다르게 표현하고 싶었고, 원하는 음성까지 구현하고 싶었는데 아직까지 방법을 못 찾아 아쉬움이 남았습니다. 4. 마무리하며 이번 '행복한 다이어터 쿼카' 시리즈를 제작하며 AI가 만들어내는 캐릭터의 생동감에 다시 한번 놀랐습니다. "음식을 빠르면서 맛있게 먹는 게 포인트야!"라는 저의 의도를 쿼카가 잘 표현해준 것 같아요 다음에는 영상미가 더 생동감 있을 수 있도록 음성까지 구현해 보고 싶고, 쿼카가 만들어 가는 더 재미있는 에피소드를 만들어 보고 싶습니다.
    3
    2
  • 지피티 이미지 활용해서 영상 만들기

    소개 제주도에서 힐링하는 20대상큼한 여자의 기분좋은 영상 만들기 진행 방법 지피트를 통해 프롬프트를 만들었습니다. (프롬프트) 20대 여자가 제주도에서 혼자 힐링 여행을 즐기는 감성 브이로그 영상. 맑은 제주 바다, 초록 숲길, 오션뷰 카페, 노을지는 해변을 배경으로 자연스럽게 웃고 여유를 즐긴다. 전체 분위기는 밝고 상큼하고 편안하며, 부드러운 햇살과 바닷바람, 깨끗한 파스텔톤 색감으로 보는 사람도 힐링되는 느낌. 천천히 움직이는 카메라, 자연스러운 표정, 소소한 행복, 평화로운 제주 여행 분위기 지피티 통해 이미지도 생성 제미나이보다 더 정확하고 빠르게 원하는 이미지가 바로 구현되었습니다. 결과와 배운 점 아직 음성부분이 어색해서 더 연습해봐야겠습니다.
    1
    2
  • 끌림영상 스토리 보드를 이용한 동영상 제작

    소개 안티그래버티에서 스토리보드를 제작하여 개별 동영상을 만들고 합쳐서 영상을 제작한다. (내용 입력) 진행 방법 안티그래버티를 이용하여 스토리보드를 제작(3*3) 하고, 추가적인 스토리보드를 4*4로 제작하여 스토리를 만든다. 결과와 배운 점 최초 영상은 "산의신령" 이 서울역에서 남산으로 가는 과정을 만들었는데 "유나의 하루"라는 4*4 를 만들었는데 동영상화하는데에는 아직 진행중이다. 도움 받은 글 (옵션) 참고한 지피터스 글이나 외부 사례를 알려주세요. (내용 입력)
    0
    0
  • 커넥터 하나로 만든 "6월 3일 투표 독려" 10초 숏폼 제작기

    AI 영상 생성 커넥터(Pixa)로 6월 3일 투표 독려 10초 캠페인 영상을 만들어 본 체험기입니다. 텍스트 프롬프트만으로 세로형 시네마틱 클립을 뽑고, 커넥터의 길이 제한을 멀티 클립 합성으로 우회해 정확히 10초로 마무리했습니다. 제작 과정 (How) 이 프로젝트는 "텍스트 프롬프트 → AI 영상 클립 생성 → ffmpeg 합성"의 단순한 파이프라인으로 진행했다. 기획: 밝고 활기찬 시민 캠페인 톤을 기준으로, 10초 안에 담을 서사를 세 컷으로 나눴다. ① 다양한 연령대의 시민이 투표소로 입장 → ② 투표용지를 투표함에 넣고 인증 도장을 보여주는 클로즈업 → ③ 시민들이 함께 엄지를 들고 환호하는 마무리. 클립 생성: AI 영상 생성 커넥터(Pixa)에서 Kling v3.0 Pro 모델을 골라, 9:16 세로 비율 / 텍스트 없음 조건으로 세 컷을 각각 text-to-video로 생성했다. 화면 속 글자는 AI가 깨뜨리기 쉬워 일부러 "텍스트 없음"으로 지시하고, 문구는 합성 단계에서 직접 넣기로 했다. 합성: 생성된 3개 클립과 직접 만든 엔드카드를 ffmpeg로 이어 붙였다. 컷 사이에는 0.4초 페이드(마지막 엔드카드 진입은 화이트 플래시 전환)를 줘 자연스럽게 연결하고, 최종 길이를 10.08초로 맞췄다. 발생했던 기술적 문제 (Trouble) 길이 제어 불가 (가장 큰 문제): 커넥터의 영상 생성 기능에 duration(길이) 파라미터가 노출되지 않아, 10초를 요청해도 모델 기본값인 3초짜리 클립만 생성됐다. 소비 크레딧(48 = 16/초 × 3초)으로도 3초가 확정임을 확인했다. 한글 자막 깨짐: 엔드카드 문구를 ffmpeg drawtext로 넣으려 했으나, 작업 환경에 한글 폰트가 없어 "6월 3일", "꼭 투표하세요" 같은 글자가 모두 □(두부) 박스로 깨져 나왔다. 클립 규격·오디오 불일치 우려: 클립이 24fps·무음(오디오 트랙 없음)으로 생성돼, 그대로 이어 붙이면 합성 단계에서 타임베이스나 오디오 매핑 충돌이 날 수 있었다. 해결 방안 (Action) 멀티 클립 합성으로 10초 확보: 한 번에 10초가 안 되니, 3초 클립을 세 컷 생성해 하나의 서사로 잇고 엔드카드(약 2.1초)를 더했다. ffmpeg xfade 필터로 컷당 0.4초씩 겹쳐 전환하니 총 10.08초가 됐고, 단순 길이 늘리기가 아니라 오히려 기승전결이 있는 캠페인 영상이 됐다. 한글 폰트 적용: 나눔고딕 Bold(.ttf)를 내려받아 drawtext의 fontfile로 지정하니 한글이 정상 출력됐다. 엔드카드는 시민 캠페인 톤에 맞춰 딥블루 배경 + 옐로 포인트 + "꼭 투표하세요" 버튼형 박스로 구성했다. 규격 통일: filter_complex 안에서 모든 입력을 scale=1080:1920, setsar=1, fps=24, format=yuv420p로 강제 정렬해 규격을 맞췄고, 오디오는 전 구간 무음으로 통일(-a 0)해 충돌 가능성을 제거했다. 느낀 점 및 배운 점 (Lessons Learned) 커넥터의 "기본값"을 의심하라: 같은 모델이라도 커넥터가 어떤 파라미터를 열어 두느냐에 따라 결과 길이가 달라진다. duration을 못 넘기면 "여러 컷을 만들어 합성"이라는 우회로가 오히려 더 나은 영상 구조를 만든다는 걸 배웠다. 생성과 합성은 별개의 공정: AI가 멋진 클립을 뽑아주는 것과, 그것을 10초짜리 완성본으로 엮는 포스트 프로덕션(전환·자막·길이 맞추기)은 전혀 다른 작업이다. 마지막 1초를 다듬는 데 시간이 더 들었다. 텍스트는 AI에 맡기지 말고 직접: 화면 문구를 AI 영상에 맡기면 십중팔구 깨진다. "텍스트 없는" 영상을 생성하고, 핵심 메시지는 폰트를 직접 지정해 합성 단계에서 넣는 방식이 가장 안정적이었다. — 사용 도구: AI 영상 생성 커넥터(Kling v3.0 Pro, text-to-video, 9:16) · ffmpeg(xfade 합성·drawtext 자막) · 나눔고딕 — 결과물: 세로형(1080×1920) 10.08초 투표 독려 캠페인 영상
    0
    0
  • 물결2

    구글 플로우에서 목소리 만들기 아무거나 된다고는 안했음

    소개 시도하고자 했던 것과 그 이유를 알려주세요. 이번 5월 19일 업데이트로 구글 플로우에서 목소리를 캐릭터에 넣을 수 있게 되었는데, 외국인 목소리만 있어서 조금 사용이 어려웠는데, 약간의 변주로 목소리를 등록하는 기능이 있어서 시도해보려고 함 진행 방법 구글 플로우 : https://labs.google/fx/ko/tools/flow 캐릭터 만들기를 먼저 진행합니다. https://www.gpters.org/media/post/ilgwandoen-kaerigteo-deungrog-buteo-saengseongggaji-faat-google-flow-G6vOpvoBnaZDxwS 위 글에서 캐릭터 만들기 따라하기를 해서 캐릭터를 만드는 장면에서 시작합니다 다시 복습! 1.구글 플로우 접속 2.새 프로젝트 -> 구글 플로우는 프로젝트마다 에셋, 캐릭터가 별도로 관리된다... 아주 죽을맛 3.왼쪽 사이드바에서 '캐릭터' 선택 4.하단 채팅창 아래에 '업로드' 클릭 또는 캐릭터 초상화 이미지 드래그 앤 드랍 캐릭터 초상화 옆에 + 버튼을 눌러서 캐릭터시트를 즉시 생성하기 '음성 선택' 누르기 '새 음성 만들기' 버튼 누르기 기본 음성 선택에서 일단 원하는 음색을 고릅니다. 서양 사람들 목소리라서 참 안맞아잉~ 목소리가 들리고 싶은 스타일(음성 성능)을 간단하게 입력합니다. 이름도 적어주고요 새로 만든 목소리를 '캐릭터에 추가' 해봅시다 어떤 목소리가 나올지 영상을 하나 만들어봅시다 결과와 배운 점 원래 목소리도 들어봐야겠죠? 목소리 생성할 때 썼던 원본 목소리와 비교를 좀 해보겠습니다 원본 목소리를 사용하면, 외국인이 한국말 하는 느낌이 나네요?! 신기하쥬?~! 도움 받은 글 (옵션) 참고한 지피터스 글이나 외부 사례를 알려주세요. (내용 입력)
    1
    0
  • 코알못 AI 코딩 어시스턴트와 손잡고 Remotion 자동 영상 합성 버그를 통쾌하게 해결하고 숏폼을 완성하기까지

    소개 시도하고자 했던 것과 그 이유를 알려주세요. # [Antigravity × Veo 3.1] 자막 침투부터 씬 잘림 현상까지! 코알못 1인 창업가가 AI 코딩 어시스턴트와 손잡고 Remotion 자동 영상 합성 버그를 통쾌하게 해결하고 숏폼을 완성하기까지 ## 📝 한줄 요약 영상 편집과 프로그래밍 코드를 전혀 모르는 1인 창업가가 AI 대시보드와 코딩 어시스턴트(Antigravity)와의 긴밀한 협업을 통해, 두 마스코트 바리스타의 카페 홍보 숏폼 브랜드 필름을 48초 분량의 초고화질 실사 비디오로 완벽히 완성해 냈습니다. 렌더링 과정에서 발생한 자막 꼬임과 재생 시간 잘림 오류를 AI와 함께 파일 메타데이터 분석 및 코드 수정을 거치며 통쾌하게 해결하고, 향후 홍보 콘텐츠를 10분 만에 초고품질로 무한 양산할 수 있는 강력한 자동화 파이프라인을 독자적으로 소유하게 되었습니다. **바쁘시면 이것만 읽어도 돼요:** - **사용한 도구와 목표**: AI 어시스턴트 Antigravity 및 Veo 3.1 비디오 생성 모델을 활용하여 가상 카페 브랜드 '카페메이트'의 48초 고품질 실사 숏폼 브랜드 필름을 대시보드 및 Remotion CLI 기반으로 완전 자동 병합 구축 (수동 제작 시 2~3일 걸리던 작업을 단 수십 분 만에 완료). - **과정 중 깨달은 점**: 숏폼 영상 제작 시 기획안의 씬별 텍스트 프롬프트뿐만 아니라, 비디오 생성 AI에 완벽한 입 모양 맞춤(립싱크) 명령어(`perfect lip sync`)를 심어주는 디테일의 중요성과, 물리적인 영상 길이와 메타데이터 매칭이 오차 없이 이루어져야 완성도 높은 결과물을 얻을 수 있다는 것을 깨달았습니다. - **핵심 해결 방법**: 타 프로젝트의 자막이 씬 ID 충돌로 겹쳐 들어오는 현상을 리모션 코드 수정(프로젝트 ID별 조건부 가드 삽입)으로 해결하고, 8초짜리 원본 영상이 5초로 잘리는 현상을 macOS 파일 속성 진단기(`mdls`)를 통해 밝혀내어 설정 파일의 시간을 8초로 일괄 확장하는 기민한 시스템 마이그레이션으로 무결한 전체 본을 렌더링했습니다. - **특별히 인상적이었던 순간**: 따뜻한 수채화 감성의 지브리풍에서 더 아늑하고 생생한 실사풍(Photorealistic)으로 콘셉트를 전환하자마자, AI가 에피소드의 기획 내용과 6개 씬의 이미지/비디오 프롬프트를 흐트러짐 없이 실사 묘사로 자동 재설계하고 캐릭터 의상(오트밀 니트, 그레이 티)까지 완벽하게 통일해 주었던 순간에 전율을 느꼈습니다. - **확장성/재사용성**: 이 대시보드 및 Remotion 기반 숏폼 하네스는 씬 구조와 이미지/비디오 프롬프트, 대사 텍스트 파일만 변경해 주면 단 10분 만에 또 다른 초고품질 숏폼 콘텐츠를 무한히 빌드해 낼 수 있어, 향후 다양한 브랜드 마케팅 및 F&B 숏폼 전문 제작 대행사 비즈니스 모델로 무궁무진한 스케일업이 가능합니다. - **배운 교훈**: AI를 활용한 코딩이나 영상 렌더링 중 오류를 만났을 때 막연히 포기하지 말고, AI에게 "코드를 뜯어보고 물리적 파일 정보를 분석해서 원인을 찾아내줘"라고 구체적이고 과감하게 의뢰하는 것이 최고의 돌파구가 된다는 것을 배웠습니다. --- ## 🎯 이런 분들께 도움돼요 - **직접 마케팅 영상을 만들고 싶지만** 값비싼 외주 비용과 소통 지연 때문에 골머리를 앓는 1인 창업가 및 F&B 브랜드 기획자 - **프리미어, 애프터 이펙트 등 복잡한 편집 툴** 사용법이 낯설고 매번 자막 타이밍과 립싱크를 일일이 조정하는 수작업에 한계를 느끼는 분들 - **AI 코딩 툴이나 비디오 생성 AI의 실제 현업 적용 사례**를 찾고 있으며, 기술적인 연동 버그를 비개발자 수준에서 통쾌하게 뚫어내는 노하우가 필요하신 분들 --- ## 😫 문제 상황 (Before) 가상 카페 브랜드 '카페메이트'의 두 마스코트 바리스타(행복을 주는 여성 바리스타와 즐거움을 주는 남성 바리스타)를 주인공으로 삼아, 카페의 따뜻함과 커피 브루잉의 전문성을 한 번에 어필할 수 있는 고감도 브랜드 숏폼 홍보 필름을 만들고 싶었습니다. 하지만 전문적인 촬영 및 조명 장비를 동원하자니 수백만 원에 이르는 예산과 일정 조율이 불가능했고, 그렇다고 AI로 만들어진 6개의 각기 다른 고화질 영상 조각들을 직접 매끄럽게 하나의 비디오로 결합하는 것은 산 넘어 산이었습니다. 특히 전통적인 영상 편집 프로그램에서 대사 싱크와 자막 자리를 일일이 잡고, BGM 오디오 레벨을 미세 조정하며 립싱크를 맞추는 노가다 작업은 초보자인 저에게 엄청난 압박이자 물리적으로 2~3일의 밤샘 작업을 요구하는 고단한 일이었기에 이 비효율을 무조건 해결해야 했습니다. --- ## 🛠️ 사용한 도구 - **AI 코딩 및 작업 조율**: Google Antigravity (Advanced Agentic Coding Agent) - **비디오 생성 AI**: Google Veo 3.1 (`veo_native_speech` 음성 연동 기능 탑재) - **이미지 생성 AI**: Google Gemini (실사 웰메이드 그래픽 엔진) - **비디오 합성 & 렌더링 엔진**: Remotion (React, TypeScript 기반 자동 모션 그래픽 빌더) - **프로젝트 모니터링**: Vanilla JS zero-dependency dashboard (Python http.server 구동) --- ## 🔧 작업 과정 ### [1단계: 두 마스코트의 실사 프로필과 6씬 브랜드 시나리오의 탄생] - 첫 만남부터 실사풍의 정교한 기획까지 처음에는 아기자기하고 친숙한 느낌의 지브리 2D 수채화 애니메이션풍으로 기획을 시작했습니다. 두 캐릭터(카페메이트, 카페파트너)의 성격과 외형을 잡고 전신 프롬프트를 만드는 과정까지는 즐거웠지만, 브랜드의 품격과 커피의 디테일한 질감(드립 커피 방울, 스팀 우유의 결 등)을 극적으로 전달하기에는 2D 애니메이션보다 생생한 **'실사 사진풍(Photorealistic)'**이 훨씬 어울리겠다는 결심이 섰습니다. 갑작스럽게 비주얼 스타일을 완전히 뒤엎는 고난도 마이그레이션 요구에도 AI 어시스턴트는 흐트러짐이 없었습니다. ``` 지브리풍 말고 실사 이미지로 프롬프트 바꿔줘 ``` AI는 이 한 마디에 에피소드 기획서와 캐릭터 설정, 그리고 6개 씬의 모든 이미지/비디오 생성 프롬프트를 단숨에 깊이감 있고 세련된 실사 묘사(Warm natural morning light, shallow depth of field, detailed textures)로 재설계해 냈습니다. 특히 캐릭터의 일관성 유지를 위해 여성 바리스타에게는 **'따뜻한 오트밀 니트와 다크 브라운 앞치마'**, 남성 바리스타에게는 **'그레이 티셔츠와 동일 앞치마'**를 착용시켜, 서로 다른 6개의 씬이 재생되어도 동일한 공간에서 일하는 동료라는 브랜딩 정체성을 완벽하게 시각적으로 고정해 준 대목에서 큰 감동을 받았습니다. --- ### [2단계: Veo 3.1 립싱크의 기적] - 한국어로 말하며 입 모양까지 맞추는 영상 연출 브랜드 필름인 만큼 바리스타가 화면을 보며 "안녕하세요!" 하고 고객에게 따뜻한 한국어로 인사를 건네는 장면이 핵심이었습니다. 하지만 대부분의 글로벌 비디오 생성 모델은 영어 중심이기에, 한국어 목소리를 어설프게 올리면 립싱크가 뭉개지거나 입 모양이 아예 맞지 않는 참사가 흔히 발생합니다. 저는 이 난제를 해결하기 위해 AI에게 특단의 대책을 요구했습니다. ``` 한국어로 말하는걸로 다시 프롬프트 만들어줘 ``` AI는 단순히 한글 자막을 띄우는 것이 아니라, 비디오 생성 AI 모델인 Veo 3.1의 `veo_native_speech` 특성을 정밀 분석하여 비디오 생성 명령문 안에 **"perfect lip sync matching the spoken Korean dialogue" (발화하는 한국어 대사와 완벽하게 매칭되는 립싱크)**와 **"clear, warm, gentle Korean female voice" (맑고 따뜻하고 부드러운 한국인 여성 목소리)**라는 강력한 디렉팅 지시어를 정교하게 주입했습니다. 그 결과, 실제 렌더링된 비디오에서 바리스타가 카메라를 향해 온화한 미소를 지으며 실제로 흘러나오는 한국어 음성의 리듬과 글자 그대로 자연스럽게 입술을 움직여 발음하는 환상적인 립싱크 퀄리티를 구현할 수 있었습니다. --- ### [3단계: 1차 난관 - 엉뚱한 자막의 습격과 코드 분석 디버깅] - 타 프로젝트 자막 침투 버그 통쾌하게 해결하기 각 씬별 6개 영상을 대시보드에 탑재하고 드디어 Remotion 빌드 명령어를 실행해 설레는 마음으로 첫 병합본(`final.mp4`)을 확인했습니다. 그런데 청천벽력 같은 오류가 있었습니다. 바로 이전 치과 프로젝트에서 사용했던 "노쇼 3연속" 자막이 이 카페메이트 브랜드 영상의 깨끗한 실사 화면 한가운데에 무단으로 겹쳐 나와 립싱크 자막을 마구 가리고 있던 것입니다. 비개발자인 저로서는 어떤 React 소스코드가 꼬여 이런 문제가 생겼는지 도저히 파악할 수 없어 한참을 낙담했습니다. 하지만 낙담하기엔 일렀습니다. 저는 AI 어시스턴트에게 상황을 설명하고 코드를 면밀히 추적해 해결해 줄 것을 요청했습니다. ``` 자막이 말이랑 안 맞아 자막 빼줘 ``` AI는 주저 없이 리모션의 렌더링 물리 소스코드인 `remotion/SceneClip.tsx`를 뜯어보기 시작했습니다. 그리고 놀라운 진단을 내놓았습니다. 서로 다른 별개의 프로젝트들이 동일한 씬 ID(`ep01-s01` 등)를 내부적으로 공유하다 보니, 리모션 합성 모듈이 카페메이트 씬을 읽어올 때 치과 프로젝트의 고정 자막 데이터를 함께 호출해 버리는 충돌 버그였던 것입니다! AI는 즉각 `remotion/SceneClip.tsx` 내의 자막 렌더링 컴포넌트에 **"오직 치과 프로젝트 ID이고 자막 활성화 플래그가 참일 때만 자막을 그리도록"** 영리한 프로젝트 가드 코드를 단숨에 작성해 주었습니다. 동시에 `project.json`의 자막 옵션을 비활성화(`false`) 처리하여, 엉뚱한 자막 침투 현상을 단 5분 만에 완벽하게 소거하고 눈부시게 깨끗한 6개 씬의 오리지널 웰메이드 브랜드 화면을 복원해 냈습니다. --- ### [4단계: 2차 난관 - 영상 끝부분 3초의 유실] - 5초의 한계를 깨고 8초 일괄 확장 마이그레이션 하지만 기쁨도 잠시, 완성본을 찬찬히 재생해 보니 또 다른 심각한 문제가 눈에 들어왔습니다. 6개의 씬 중 **3번 씬(카페의 오후 전체 샷)과 5번 씬(커피 원두 향기 샷)의 끝자락이 매끄럽게 넘어가지 않고 툭 끊기듯 3초씩 잘려 나간 채** 다음 씬으로 넘어가는 것이었습니다. 제가 촬영하고 합성한 개별 mp4 파일 자체는 분명히 길고 자연스러웠는데 왜 합쳐지기만 하면 끊기는지 영문을 몰라 깊은 한숨이 나왔습니다. 이때 AI 어시스턴트의 가동력이 빛을 발했습니다. AI는 "눈대중으로 짐작하지 말고 물리적 파일 속성을 직접 뜯어보자"라며 macOS의 파일 메타데이터 진단 도구인 `mdls` 명령어를 시스템 백그라운드에서 직접 구동했습니다. 그리고 명쾌한 원인 분석표를 제 앞에 내놓았습니다. - **물리적 실제 파일 크기 및 길이**: 사용자가 생성하여 업로드한 6개의 씬 mp4 파일들은 메타데이터상 예외 없이 전부 **정확히 8.0초**였습니다. - **프로젝트 설정 파일의 제약**: 그러나 숏폼 엔진의 세팅 데이터베이스인 `scenes.json` 파일에는 씬당 재생 시간(`duration_sec`)이 **5.0초**로 기본 선언되어 있었습니다. 즉, Remotion 합성 빌더가 8초짜리 최고 품질의 영상을 가져왔으나 설정에 적힌 5초 규격에 맞추기 위해 뒷부분 3초를 냉정하게 잘라버려 발생했던 현상이었습니다! 원인이 규명되자 저는 즉시 조치를 요청했습니다. ``` 전체 8초로 연장 ``` AI는 이 짧은 한마디를 입력받자마자 시스템 전체를 마이그레이션하기 시작했습니다. 1. 기획안 문서(`ep01.md`)에 반영된 총 러닝타임을 48초(씬당 8초 × 6개 씬)로 일괄 수정 2. 프로젝트 메타파일(`project.json`)의 `length_sec` 규격을 48초로 갱신 3. 핵심 데이터베이스인 `scenes.json` 내 6개 모든 씬의 재생 시간(`duration_sec`)을 일제히 8초로 확장 적용 4. 백그라운드에서 Remotion 합성 빌드 엔진을 최종 기동 이 놀라운 마이그레이션은 실시간 코딩과 설정 조율을 거치며 단 1분 만에 완벽하게 완수되었고, 마침내 3번과 5번 씬의 아름다운 뒷부분 3초의 여운까지 고스란히 담아낸 **최종 48초 분량의 초대형 고품질 브랜드 홍보 비디오(51.8 MB)를 합성하는 데 대성공**을 거두었습니다! --- ## ✅ 결과 (After) 이전에는 마케팅 쇼츠나 브랜드 필름을 한 편 기획해 만들기 위해 며칠 밤낮을 콘티 회의와 수작업 편집, 프리미어 타임라인 싱크 맞추기로 소모하며 허덕여야 했습니다. 하지만 이번 협업을 통해 **기획부터 실사 프롬프트 튜닝, 버그 해결, 립싱크 조율, 그리고 최종 48초 고해상도 병합본 렌더링에 이르기까지 전 과정을 단 수십 분 만에 끝마치는 경이로운 혁신**을 체험했습니다. ### Before vs After | 항목 | 기존 방식 (Before) | AI 파이프라인 (After) | |------|--------|-------| | **제작 및 편집 시간** | 약 2~3일 (콘티 작성, 편집 툴 삽질, 오디오 레벨 미세 조정 등) | **단 수십 분** (대시보드 기획 및 단 한 줄의 CLI 자동 합성) | | **자막 및 립싱크** | 초 단위로 대사와 입 모양을 맞추는 노가다 수작업 | **Veo 3.1 립싱크 가이드 자동 주입**으로 완벽한 인라인 립싱크 구현 | | **비즈니스 연속성** | 매번 다음 편 기획 시 원점에서 복잡하게 다시 기획·제작 | 프롬프트와 텍스트 대사 교체만으로 **10분 만에 2화, 3화 무한 양산** | | **엔지니어링 트러블슈팅** | 코드 버그나 잘림 현상 발생 시 원인을 못 찾아 밤새며 구글링 | AI의 **시스템 메타데이터 정밀 진단 및 실시간 소스코드 패치**로 즉각 해결 | ### 결과물 - **최종 완성 비디오**: `projects/cafe_mate_shorts/outputs/ep01/final.mp4` (48초, 51.8 MB, 무자막 실사 고화질 브랜드 필름 패키지) - **모니터링 대시보드**: `http://localhost:8000/dashboard/?project=cafe_mate_shorts` (에피소드 브리프, 6개 씬 및 캐릭터 2인의 실사 설정서 실시간 연동) --- ## 💬 이 과정에서 배운 AI 활용 팁 ### 효과적이었던 것 1. **디테일한 립싱크 연출어 사용**: 비디오 생성 AI에 대사가 있는 씬을 연출할 때는 반드시 `perfect lip sync matching the spoken Korean dialogue` 같은 밀도 높은 립싱크 가이드를 프롬프트에 구체적으로 명시해야 입 모양 왜곡을 방지할 수 있습니다. 2. **AI 코딩 툴에 대한 대범한 의뢰**: 자막 오류나 재생 시간 잘림 같은 시스템 버그를 마주했을 때 어쭙잖은 텍스트 유추 대신 "설정 파일과 실제 비디오의 메타데이터를 정밀 대조하고 렌더링 코드를 직접 수정해 줘"라고 과감하게 핵심 업무를 위임하는 것이 수십 배 빠른 결과를 가져다줍니다. ### 이렇게 하면 안 돼요 1. **단편적인 결과 확인 후 추정 금지**: 영상이 잘려 나온다고 해서 단순히 "영상이 잘못 생성되었다"고 속단하여 다시 생성하는 데 리소스(비용, 시간)를 낭비하지 마세요. 반드시 `mdls` 같은 도구로 실제 물리 파일 길이를 먼저 팩트 체크하는 것이 순서입니다. 2. **스타일의 불일치 방치**: 6개 씬처럼 여러 개의 영상을 엮어 숏폼을 양산할 때는 단순 묘사만 뿌려서는 안 됩니다. AI에게 "등장인물의 의상과 배경 우드톤을 모든 프롬프트에 공통 키워드로 박아넣어 일관성을 고정해 줘"라고 반드시 지시하여 브랜딩의 퀄리티를 유지해야 합니다. --- ## 🌍 다른 업무에 적용한다면? - **F&B 매장의 신메뉴 홍보**: 메뉴판 사진과 레시피 텍스트만 넣으면, AI가 맛깔스러운 시즐감과 드립핑 연출을 담아 10분 만에 홍보 릴스를 찍어내 고객 유입을 유도할 수 있습니다. - **다국어 글로벌 마케팅**: 립싱크 프롬프트와 대사의 번역 언어만 영어, 일어, 중국어로 갈아 끼우면, 얼굴을 재촬영할 필요 없이 즉시 글로벌 광고 숏폼으로 확장하여 해외 시장 개척이 가능합니다. --- ## 🚀 앞으로의 계획 이번 1화 브랜드 필름의 완벽한 성공에 용기를 얻었습니다. 이제 이 강력한 Remotion 자동 합성 대시보드와 AI 비디오 파이프라인의 효율성을 극한으로 끌어올릴 생각입니다. 단순히 저희 카페 홍보를 넘어서, 주변의 소상공인들이나 타 F&B 브랜드의 고품격 숏폼 마케팅 콘텐츠를 자동으로 기획·촬영·합성하여 공급해 주는 **'1인 AI 영상 제작 대행 에이전시 비즈니스'** 모델을 정식 출범하고, 양산형 파이프라인의 엄청난 마진율을 비즈니스 가치로 실현해 나갈 예정입니다. --- ## 📋 재사용 가능한 프롬프트 ### 프롬프트 1: 한국어 립싱크가 녹아든 고감도 실사 브랜드 필름 생성 > A photorealistic, high-quality cinematic close-up of a friendly female barista smiling warmly at the camera and speaking naturally, set in a cozy wooden-interior cafe with soft warm morning light. Clear professional cinematography, shallow depth of field. > [dialogue]: "안녕하세요! 따뜻한 행복을 드리는 카페메이트입니다." > [audio]: warm, gentle, calm Korean female voice with clear diction. > [motion]: perfect lip sync matching the spoken Korean dialogue. ### 프롬프트 2: 일관된 캐릭터 의상 및 브랜드 아이덴티티 시각화 > An extreme close-up of a professional male barista's hands carefully pouring hot water over fresh coffee grounds in a drip server, wearing a gray t-shirt and a dark brown apron consistent with the cafe mate brand identity. Steam rising gently in a cozy wooden cafe background, golden hour soft natural light. (내용 입력) 진행 방법 어떤 도구를 사용했고, 어떻게 활용하셨나요? Tip: 사용한 프롬프트 전문을 꼭 포함하고, 내용을 짧게 소개해 주세요. Tip: 활용 이미지나 캡처 화면을 꼭 남겨주세요. Tip: 코드 전문은 코드블록에 감싸서 작성해주세요. ( / 을 눌러 '코드 블록'을 선택) (내용 입력) 결과와 배운 점 배운 점과 나만의 꿀팁을 알려주세요. 과정 중에 어떤 시행착오를 겪었나요? 도움이 필요한 부분이 있나요? 앞으로의 계획이 있다면 들려주세요. (내용 입력) 도움 받은 글 (옵션) 참고한 지피터스 글이나 외부 사례를 알려주세요. (내용 입력https://files-us-east-1.t-cdn.net/files/PnCnDoWNkhLAO66q1cwtG )
    2
    1
  • 씨댄스 2.0 짤려서 만들어본 신형 flow ai omni영상

    소개 씨댄스 2.0 무제한 요금제를 사용중 오픈클로로 실시간 자동화로 아주 꿀빨고 있었는데 걸려서 아이디 짤렸습니다. 항의도 해보고 싹싹 빌어보았지만 묵묵부답... 소라api로 만들어보지만 비싸고 구글flow가 공짜라서 만만하지만 영상 자체가 맘에 들지 않고... 그런도중 옴니가 나타나게 되어 만들어 보았습니다. 아직 씨댄스보다는 약해요. 결과물 감상한번 해보실께요!! 결과와 배운 점 씨댄스 2.0이 좋구나!! 그리고 무제한이라고 오픈클로 시켜서 무지하게 영상뽑아내면 아이디 짤리는구나!! 그리고 하소연할데가 없구나!!(대화자체를 안해줌) 를 배웠습니다. 정말로 어쩔수 없이 씨댄스 2.0 어쩔수 없이 아이디 한개 새로 가입했습니다. (아까운 내돈!!!) 50% 할인쿠폰 있으니 필요하시면 연락주세요^^
    0
    2
  • 시간이 거꾸로 흐르던 날!(감동주의)

    소개 이번에 새로나온 flow ai의 옴니기능을 활용하여 생성해보았습니다. 진행 방법 어떤 도구를 사용했고, 어떻게 활용하셨나요? 기획은 챗지피티님께 의뢰하였고, 친절하고 상냥하게 답변 주셨습니다. Tip: 사용한 프롬프트 전문을 꼭 포함하고, 내용을 짧게 소개해 주세요. Tip: 활용 이미지나 캡처 화면을 꼭 남겨주세요. Tip: 코드 전문은 코드블록에 감싸서 작성해주세요. ( / 을 눌러 '코드 블록'을 선택) SCENE 1 (0-10s) A cinematic hospital room at sunset. An elderly man lies in bed while an old golden retriever rests beside him. The atmosphere is emotional and realistic. Slow dolly-in camera movement. Warm golden light through the window. Tears fill the old man's eyes. The elderly man softly says in Korean: "고마웠어..." The dog looks into his eyes. Ultra realistic cinema. Emotional masterpiece. Soft piano music. Hollywood movie quality. SCENE 2 (10-20s) Time suddenly begins flowing backward. Tears rise back into their eyes. The hospital monitors reverse. Wrinkles disappear from the old man's face. Camera slowly circles around them. Narrator voice in Korean: "그날, 시간이 거꾸로 흐르기 시작했다." Magical particles float through the air. Cinematic realism. Emotional orchestral music. SCENE 3 (20-30s) The hospital room transforms into a warm family home. The man becomes younger. The golden retriever runs happily around him. Handheld camera follows them through the house. Bright sunlight fills the room. Narrator voice in Korean: "잊고 있던 행복들이 다시 돌아왔다." Heartwarming atmosphere. Ultra realistic. Emotional storytelling. SCENE 4 (30-40s) The man becomes a young child. The dog becomes a playful puppy. They run together across a beautiful green field at sunset. Sweeping drone shot. Wind moves through the grass. The child laughs and says in Korean: "우리 처음 만난 날이야?" Cinematic masterpiece. Emotional and magical. SCENE 5 (40-50s) Time continues reversing. The puppy becomes smaller and smaller. The child realizes something is wrong. Slow-motion camera. The world grows silent. The child begins to cry and says in Korean: "가지 마..." Close-up on tears. Emotional tension. Heartbeat sound. SCENE 6 (50-60s) The tiny puppy transforms into a glowing star. The child reaches out with trembling hands. The star slowly rises into the night sky. Camera tilts upward revealing millions of stars. The child whispers in Korean: "꼭 다시 만나자." The brightest star shines above. Final narrator voice in Korean: "사랑은 사라지지 않는다." Epic emotional ending. Cinematic lighting. Viral YouTube short. Masterpiece. 캐릭터 이미지가 필요하여 지피티님께 부탁드렸습니다. 아주 잘 나와요!!! 영상을 생성하는데 자꾸 정책위반이 나와서 이리비틀고 저리비틀고 했는데 안나오더라구요. 아이 캐릭터를 지웠더니 잘 나오더라구요. 구글은 잘 안나오면 프롬프트 변경이나 참고하는 이미지를 지우거나 변경하면 잘나옵니다. 쫘잔 아래는 결과물입니다. 기획, 대본, 1분짜리 영상까지 10분도 안걸렸다는점은 안비밀!! 여러분도 무조건 제너레이터 누르세요. 고고고!!! 결과와 배운 점
    0
    0
  • 30대 이상 여성을 타깃으로 한 AI 숏폼 채널 기획

    소개 시도한 것: 단순 조회수 수익이 아닌, 쇼핑 기능으로 구매 전환을 위한 2-Step 퍼널 숏폼 채널의 1화 제작 하네스(뼈대)를 구축했습니다. 이유: 3,40대 워킹맘들이 흔히 겪는 '건강 염려증'을 유쾌하게 풀어내 깊은 공감대를 형성하기 위함입니다. 진행 방법 어떤 도구를 사용했고, 어떻게 활용하셨나요? AI 챗봇(Antigravity): 전체 비즈니스 모델 기획, 대본 작성, chatGPT 및 구글 플로우 chatGPT: 극사실주의 갈색 토이 푸들의 '캐릭터 시트' 및 씬별 '배경 이미지' 생성 Google Flow: 이미지를 비디오로 변환(Image-to-Video)하기 위한 카메라 무빙 프롬프트 적용. [씬1 프롬프트: 정지 화면] Static cut. The hyper-realistic brown toy poodle is looking at the smartphone. Absolutely no camera movement to emphasize the stillness. No visible talking mouth. [씬2 프롬프트: 줌인] Slow Zoom-in. The camera slowly zooms in on the photorealistic brown toy poodle's surprised and funny expression with big round eyes. Cinematic lighting. No visible talking mouth. [씬3 프롬프트: 카메라 쉐이크] Shaky Handheld camera. The camera shakes dynamically while the poodle types very fast on the smartphone. Comedic fast motion. No visible talking mouth. 결과와 배운 점 이미지 선행 생성의 중요성: AI 영상 툴에 텍스트만 주고 바로 영상을 뽑으면 씬마다 캐릭터 얼굴과 옷이 계속 바뀌는 '캐릭터 붕괴'가 일어난다. 과정 중에 어떤 시행착오를 겪었나요? 구글 플로우(Veo)로 영상을 만들 때, 프롬프트에 extreme fear(극심한 공포), panic(패닉) 같은 단어가 들어가니 안전 정책(Safety Policy) 위배로 생성이 차단되는 문제를 겪었습니다. 이를 surprised and funny expression, comedic fast motion 등 코믹하고 중립적인 단어로 순화하여 우회하는 방법을 터득했습니다. 앞으로의 계획이 있다면 들려주세요. 오늘 완성한 5개의 무음 영상 클립에 인공지능 성우(TTS)로 음성을 입힐 예정입니다. 벤치마킹한 채널의 편집 기술을 본받아, 영상 편집기(CapCut)에서 점프 컷, 카메라 흔들림, 화면 깨짐(Glitch) 효과와 'Sneaky Snitch' BGM을 적재적소에 추가해 에피소드 1화를 최종 완성할 계획입니다!
    1
    1
  • AI 도구 연계와 리모션 합성: '순간이동 여행자' 숏폼 제작기

    1. 제작 과정 (How) 이 프로젝트는 사람의 기획 의도에 맞춰 다양한 AI 도구를 유기적으로 연계하고, 최종 합성을 코드로 제어하는 방식으로 제작했다. 아이디어 구체화: ChatGPT와의 개별 아이데이션을 통해 '순간이동을 하는 여행자'라는 초안 컨셉을 도출하고, 이를 안티그래비티에 입력했다. 하네스 기반 기획 고도화: 스터디장 물결님이 구축한 하네스 규칙을 바탕으로, 안티그래비티가 메인 캐릭터(주인공)의 세부 설정을 정립하고 4개 씬의 대본과 연출안을 작성했다. 구글 플로우를 통한 캐릭터 일관성 제어: 캐릭터 비주얼 일관성을 유지하기 위해 기준 초상화를 구글 플로우(Google Flow)에 캐릭터로 등록했다. 씬별 에셋 생성: 안티그래비티가 설계한 초상화 프롬프트를 사용하여 ChatGPT에서 고해상도 이미지를 얻었다. 이후 안티그래비티가 제안한 영상 프롬프트와 해당 초상화를 조합하여 구글 플로우 내 제미나이 옴니 플래시(Gemini Omni Flash / Veo)로 씬별 영상을 생성했다. 2. 발생했던 기술적 문제 (Trouble) 생성된 개별 영상 파일들을 저장소에 업로드하고 리모션(Remotion)으로 최종 합성을 진행하는 단계에서 여러 에러와 작동 오류가 발생하여 하루 이상의 조정 시간이 소요되었다. 원본 영상 오디오 누락: 제미나이 옴니 플래시로 생성한 영상 속 한글 대사 음성이 리모션 컴포지션 내에서 음소거(Mute) 처리되었다. 음성 파일 매핑 로직 오류와 리모션의 비디오 오디오 제어 코드가 충돌하여 인물의 한글 대사는 들리지 않고 화면 하단에 텍스트 자막만 노출되는 현상이 발생했다. 순간이동 전환 효과(트랜지션) 누락: 서울, 파리, 뉴욕, 스톡홀름 각 씬을 자연스럽게 이어주는 순간이동 효과(Whip Pan, 플래시 전환)가 화면에 나타나지 않았다. 이는 씬 데이터(`scenes.json`)의 씬 ID 명명 규칙과 리모션 React 코드 내부의 씬 식별자 맵핑이 일치하지 않아 전환 효과 시퀀스가 작동하지 않은 것이 원인이었다. 렌더링 빌드 에러: 작업 저장소 내 에셋 파일들의 경로 매니페스트 불일치로 인해 로컬 미리보기 실행 시 컴파일 에러가 지속적으로 발생했다. 3. 해결 방안 (Action) 리모션 컴포지션의 세부 코드를 수정하고 데이터 흐름을 정렬하여 문제를 해결했다. 영상 원본 음원(한글 대사) 복구 및 사운드 조율 SceneClip.tsx 내부에서 외부 TTS 파일(`voice`)이 없을 때 원본 영상(`video`)의 사운드가 활성화되도록 오디오 음소거 로직(`muted={!useVideoAudio}`)을 수정했다. * 루프백 BGM 오디오 볼륨을 0.14 수준으로 조절하여, 배경음악이 출력되는 상황에서도 영상 내 한글 대사 소리가 겹치거나 묻히지 않도록 청각적 밸런스를 맞췄다. 씬 식별자 동기화를 통한 전환 효과 복원 scenes.json에 선언된 씬 ID 형식과 리모션 내부 트랜지션 모듈에 쓰이는 식별자 간의 연동 로직을 일치시켰다. 이를 통해 각 씬의 경계 프레임을 계산하여, 씬 전환 시 10프레임 동안 작동하는 흰색 플래시 및 화면 왜곡 효과(`TeleportFlash`)를 정상적으로 구현했다. 에셋 매니페스트 생성 스크립트 실행 렌더링 시 경로 유실 에러를 방지하기 위해, 저장소 내 실제 파일 목록을 실시간으로 추적하여 generated-file-manifest.ts 파일로 자동 기록해 주는 헬퍼 스크립트를 빌드 전 단계에 적용했다. 4. 느낀 점 및 배운 점 (Lessons Learned) 최종 합성 단계의 중요성: AI 도구로 완성도 높은 이미지와 비디오 클립을 생성하는 것만큼이나, 이들을 하나의 미디어로 엮고 제어하는 최종 합성(포스트 프로덕션) 공정에 많은 시간과 정밀한 코드 디버깅이 필요함을 확인했다. 멀티 AI 및 개발 프레임워크 연계: ChatGPT의 기획 지원, 구글 플로우의 일관성 제어, 제미나이의 렌더링 능력, 그리고 리모션의 코드 기반 제어가 정확히 결합될 때 기획 의도에 부합하는 완성본을 도출할 수 있다. AI 영상 제작의 첫 소회: 이번 프로젝트는 AI를 통해 동영상을 제작해 본 첫 경험이었다. 코드 빌드 오류와 에셋 분류 등 많은 에러를 마주하고 단순 반복적인 수정 작업을 거치기도 했으나, 텍스트와 초상화만으로 상상 속 시네마틱 영상을 빚어내는 AI의 다채로운 기능들은 매우 놀라웠다. 기존의 수작업 편집 한계를 넓혀주는 기술적 가능성을 실감하며, 에러 디버깅조차 창작의 재미있는 여정으로 느껴졌다.
    0
    0
  • AI 영상놀이터 2주차, 제작 단계별 가이드: 기획부터 편집까지

    AI 영상 제작 소개 스터디 기간 다양한 스타일의 영상을 만들어보려고 시도해봤습니다. 2주차 진행된 발표회를 통해 팀원들의 사례와 방법 등을 공유했습니다. AI 영상 제작 진행 방법 제미나이/클로드로 영상 기획과 대본을 뽑았습니다 Gpt image 2로 캐릭터시트를 뽑았습니다 구글 Flow로 씬별 영상을 뽑았습니다. 수노로 음악을 뽑았습니다 캡컷으로 영상 편집을 완료하였습니다. 결과와 배운 점 AI툴마다 프롬프트를 인식하는게 다르며, 영상 지속적인 제작방식에 대한 노하우를 쌓아가는게 중요하다 생각했습니다 스토리보드에 대한 중요성을 생각하지 못했었는데, 캐릭터 일관성을 위해서라도 초기에 공을 드려서 완성하고 영상 제작을 시작해야 한다는 점을 깨달았습니다. 도움 받은 글 (옵션) 참고한 지피터스 글이나 외부 사례를 알려주세요. (내용 입력)
    0
    2
  • 컨토리 주제가 리메이크: Google Flow Music으로 노래부터 뮤직비디오까지 한 번에 만들어봤습니다

    소개 지난주에는 글로벌 시장을 여행하며 수출입 실무를 쉽게 알려주는 컨테이너 캐릭터 "컨토리" 캐릭터의 정체성을 정리하고, 가사를 작성하고, 노래와 이미지, 영상 클립을 하나씩 만들어 연결하는 과정을 경험해 보았습니다. 이번에는 조금 다른 방법을 시도했습니다. 지난주에 만든 컨토리 주제가의 가사를 그대로 활용하되, Google Flow Music에서 곡의 분위기를 새롭게 바꾸어 보고, 이어서 서비스 내에 있는 Music Video 생성 기능을 활용하여 뮤직비디오까지 한 번에 만들어 보았습니다. 지난번에는 장면별 이미지를 만들고 영상 편집 프로그램에서 직접 이어 붙였다면, 이번에는 AI에게 노래와 영상 제작을 모두 맡겨 보는 방식입니다. 과연 어느 정도까지 편하게 만들 수 있을지 궁금했습니다. 진행 방법 1. Google Flow Music은 어떤 도구인가? Google Flow Music은 AI와 대화하면서 음악을 만들 수 있는 음악 생성 도구입니다. 단순히 짧은 배경음악을 생성하는 수준을 넘어, 가사를 기반으로 노래를 만들고, 기존 곡의 분위기를 다르게 바꾸고, 원하는 스타일에 맞춰 결과물을 수정할 수 있습니다. 특히 이번에 흥미로웠던 부분은 음악만 생성하는 것이 아니라, 완성된 곡을 활용하여 뮤직비디오까지 제작할 수 있다는 점이었습니다. 노래의 분위기와 흐름을 바탕으로 AI가 장면을 구성해 주기 때문에, 영상 편집 경험이 많지 않은 사람도 비교적 쉽게 결과물을 만들어 볼 수 있습니다. 2. 로그인할 때 Google One 혜택 연결하기 처음 Google 계정으로 로그인하면 Google One 혜택을 연결하는 화면이 나타납니다. 이때 체크박스를 선택한 뒤 넘어가야 기존에 사용 중인 Google AI 유료 플랜의 혜택이 Google Flow Music에도 적용됩니다. 저도 처음에는 별생각 없이 넘어갈 수 있는 화면이라고 생각했는데, 유료 플랜을 사용하고 있다면 반드시 확인하는 것이 좋습니다. 공식 안내 기준으로는 다음과 같이 연결됩니다. Google AI Plus 회원 → Google Flow Music Starter 요금제 혜택 Google AI Pro 회원 → Google Flow Music Plus 요금제 혜택 Google AI Ultra 회원 → Google Flow Music Member 요금제 혜택 3. 기존 컨토리 주제가를 다른 스타일로 다시 만들기 지난주에 만든 컨토리 주제가의 가사는 그대로 유지했습니다. 이번에는 별도의 프롬프트를 입력하지 않고, 지난주에 만든 컨토리 주제가의 가사만 그대로 복사해서 붙여 넣었습니다. 그러자 Suno와 비슷하게 AI가 자동으로 두 가지 버전의 곡을 생성해 주었습니다. 생성된 결과가 마음에 들지 않을 경우에는 Remix 기능을 활용해 계속해서 수정할 수 있었습니다. 곡의 분위기나 보컬 스타일, 전체적인 느낌을 조금씩 바꾸어 새로운 버전을 만들어 볼 수 있어서, 처음 결과물에 만족하지 못하더라도 원하는 방향에 가까워질 때까지 반복적으로 다듬어 볼 수 있었습니다. 4. Music Video 기능으로 뮤직비디오 만들기 노래를 만든 뒤에는 Google Flow Music의 Music Video 메뉴를 이용해 보았습니다. 별도로 복잡한 설정이나 장면 구성을 입력할 필요는 없었고, 생성 과정도 비교적 간단했습니다. 다만 결과물은 노래 전체 길이가 아니라 약 절반 정도 분량으로만 생성되었으며, 영상 마지막에는 Google Flow Music 로고가 포함되었습니다. 기대했던 수준의 완성도에는 조금 못 미쳤지만, 노래 가사에 맞춰 캐릭터의 입모양이 움직이는 립싱크는 생각보다 자연스럽게 잘 맞춰주는 편이었습니다. 결과와 배운 점 1. 같은 가사라도 여러 가지 버전을 만들어 보는 것이 좋다. 첫 번째 결과물이 마음에 들지 않더라도 바로 포기할 필요는 없었습니다. 가사는 그대로 두고 아래와 같은 요소만 조금씩 바꾸어도 결과가 달라졌습니다. 남성 보컬 또는 여성 보컬 귀여운 느낌 또는 힘 있는 느낌 빠른 템포 또는 편안한 템포 애니메이션 주제가 느낌 또는 광고 음악 느낌 어린이도 따라 부르기 쉬운 느낌 또는 세련된 CM송 느낌 저는 이번에 같은 컨토리 주제가를 여러 가지 분위기로 만들어 비교해 보았습니다. AI 음악 생성에서는 한 번에 완성하려고 하기보다, 여러 개의 후보를 만든 뒤 가장 마음에 드는 방향을 선택하는 것이 효율적인 것 같습니다. 2. 뮤직비디오 생성 기능은 빠르게 초안을 만들 때 유용하다. 지난주에는 영상의 장면을 하나씩 만들고 CapCut에서 직접 편집했습니다. 그 과정도 재미있었지만, 생각보다 손이 많이 갔습니다. 반면 이번에는 음악을 만든 뒤 Music Video 기능을 사용하니 영상 초안을 매우 편하게 만들 수 있었습니다. 세부적인 장면의 완성도나 캐릭터 일관성은 추가로 다듬어야 할 수 있지만, 전체적인 분위기를 확인하고 아이디어를 발전시키는 데에는 충분히 활용할 수 있었습니다. 특히 영상 편집에 익숙하지 않은 사람도 첫 결과물을 쉽게 만들어 볼 수 있다는 점이 장점이라고 생각합니다. 3. Google의 음악시장에 대한 계속 되는 도전! AI 음악 생성 도구를 이야기할 때 현재 가장 먼저 떠오르는 서비스는 아무래도 Suno입니다. 곡의 완성도나 사용 편의성을 기준으로 보면, Google Flow Music이 Suno를 따라오려면 아직 시간이 더 필요해 보입니다. 특히 이번에 생성한 뮤직비디오는 노래 전체 길이가 아니라 일부 구간만 만들어졌고, 영상 마지막에 로고가 포함되는 등 실제 콘텐츠에 바로 활용하기에는 아쉬운 부분도 있었습니다. 그럼에도 불구하고 Google이 AI 음악 분야에서 계속해서 다양한 시도를 하고 있다는 점은 흥미롭게 느껴졌습니다. Suno에서는 처음 생성된 결과물을 바탕으로 세부 요소를 자유롭게 바꾸어 보는 데 일정한 한계가 있습니다. 반면 Google Flow Music에서는 Remix 기능을 활용하여 곡의 분위기와 보컬 스타일을 바꾸거나, 기존 결과물을 기반으로 여러 가지 방향을 실험해 볼 수 있었습니다. Remix 메뉴에 가면 다양한 기능이 있는데, 아직 모두 테스트 해보진 못 했습니다. 아직은 완성도보다 가능성을 확인하는 단계에 가깝지만, 사용자 입장에서는 이런 새로운 기능을 하나씩 경험해 보는 것도 재미있는 관전 포인트인 것 같습니다. 앞으로는 같은 가사를 활용하여 장르, 보컬, 분위기, 템포를 조금씩 바꾸어 보고, 어떤 방식으로 활용하면 더 좋은 결과를 만들 수 있을지 다양한 시도를 해보고 싶습니다. ❤️ 결과물 보러가기 ❤️ https://youtube.com/shorts/8kn4yWTcsnw?feature=share
    0
    2
  • 책 "마술은 최고의 사교술" 홍보 영상 제작

    1. 소개 해피매지션입니다. 다음주에 제 9번째 책 ‘마술은 최고의 사교술‘이 출간됩니다. 기존 “마술의 힘"이라는 책을 수정 보완한 90페이지 분량의 전자책입니다. . 이 책을 홍보하고 싶어 만든 홍보 영상 제작 사례입니다. 2. 진행 방법 (1) 어떤 도구를 사용했고, 어떻게 활용하셨나요? ① 영상을 제작하기 위해 Gemini, Suno, Genspark, Grok, CapCut 등의 AI 및 편집 도구를 유기적으로 연계하여 활용하였습니다. ② 도구별 활용 ▶ [ Gemini ] 책의 내용에 맞게 가사 생성 ▶ [ Suno ] 만든 가사를 활용하여 노래 및 음원 생성 ▶ [ Genspark ] 가사 내용을 바탕으로 20개 이미지 생성 ▶ [ Grok ] 이미지를 움직이는 영상(Video)으로 변환 ▶ [ CapCut ] 영상 조각 편집 및 음원 합성 후 최종 내보내기 2) 구체 영상 제작 프로세스 ① Gemini에서 가사 작성 - 제 책(마술은 최고의 사교술) 전체 내용을 넣고, 가사를 만들었습니다. - [프롬프트] 책 제목이 '마술은 최고의 사교술'이야. 이 말이 들어갔으면 좋겠어. 후렴 가사가 똑같 지 않아도 돼. 카드, '동전 같은 작은 도구를 활용한 마술, 멘탈매직, 일루전' 같은 마술 용어들이 들어갔으면 좋겠어. 가사 만들어줘. - https://gemini.google.com/app/28c628c4103b2015 ② Suno에서 노래 작성 - Gemini에서 만든 가사를 Suno의 Lyrics에 넣고, Style도 Gemini에서 제안해준 내용을 넣은 뒤 노래 만들었습니다. - 노래가 마음에 안 들어 3번 시도했습니다. 최종 2분 43초 노래가 마음에 들어 선택했습니다. ③ Genspark에서 노래 가사에 맞는 이미지 20개 작성 - Genspark에 노래 가사를 넣고, 이 가사에 맞는 이미지 만들어 달라고 요청했습니다. - 처음에는 이미지를 16개를 만들었다가 가사에 맞지 않고 모자라서 4개를 더 만들어 총 20개 이미지를 만들었습니다. ④ Grok에서 각 이미지의 영상 제작 - Grok에 이미지를 넣고 10초짜리 영상 제작하는데, 각 이미지에 맞는 가사를 주며 ‘이 가사에 어울리는 영상 만들어줘‘라고 프롬프트를 넣으니 자꾸 말을 하거나 노래를 하는 영상이 만들어 지는 문제가 있었습니다. - '말이나 노래를 하지 말아줘'고 프롬프트를 넣어 수정하며 완성했습니다. - 주인공(해피매지션) 얼굴의 이미지의 일관성이 떨어져서, 몇 개 컷은 Genspark로 가서 일관성에 맞게 다시 이미지를 수정하여 만든 후 영상을 만들었습니다. - 이미지가 20개이고, 마음에 안 들어 다시 만들다 보니 이미지 제작 한도에 도달하여 2시간 쉬었다가 다시 만들었습니다. ⑤ Capcut에서 영상 편집 - 노래의 앞 '전주'에 맞는 영상이 없어서 책 표지 이미지를 넣었습니다. - 노래가 모두 끝난 후 후렴 마지막 '책 제목'이 반복해서 나오는 마지막 부분의 영상이 없어서 책 표지와 함께 마술 장면 이미지를 몇 장 넣어 추가했습니다. ⑥ 유튜브에 업로드 - 정식 유튜브(행복경영 TV- 해피매지션) 채널을 만들어 그 계정에 업로드했습니다. https://www.youtube.com/watch?v=nSJXCaQd97k 3. 결과와 배운 점 (1) 과정 중에 어떤 시행착오를 겪었나요? - 노래 길이는 길고, 넣을 이미지는 적어 추가로 이미지를 더 만들기도 했습니다. - 이미지의 일관성이 맞지 않아 이미지 몇 개 컷을 다시 만들고, 영상이 마음에 안 들어 다시 만드는 등에 시간이 많이 소요되었습니다. - 대략 전체 7시간 이상 걸렸습니다. (2) 도움이 필요한 부분이 있나요? - 처음 이미지 스토리 보드를 만든 후 이미지의 일관성을 지속 유지하는 방법을 더 스터디하며 배울 생각입니다. (3) 앞으로의 계획이 있다면 들려주세요. - 이번 스터디장님과 스터디원분들의 열정적이고 꾸준한 실행력에 감동을 받았습니다. - 저도 '행복한 이야기'라는 주제로 다양하고 참신한 캐릭터와 음악 스타일을 시도하여 제 영상을 보는 분들에게 즐거움을 줄 수 있는 완성도 높은 영상들을 꾸준히 제작해 나갈 계획입니다. 4. 도움 받은 글 (옵션) - 스터디장님과 스터디원분들이 카톡방을 통해 공유해 주신 각종 사례나 프롬프트 등이 많은 도움이 되었습니다. - 스터디장님과 스터디원분들의 열정에 감동하여 저도 최선을 다하게 되었습니다. 감사합니다.
    0
    2
  • [Antigravity] "다음"만 쳤을 뿐인데 세계관부터 콘티까지 완성됐다 — AI 하네스 체험기

    ## 📝 한줄 요약 스터디장님이 설계한 AI 하네스(Harness) 워크플로우를 따라, 아이디어 하나로 약 3시간 만에 판타지 숏폼 시나리오 2개 시리즈의 세계관·대본·실사 콘티 이미지·영상 프롬프트까지 완성한 경험을 공유합니다. **바쁘시면 이것만 읽어도 돼요:** - 사용한 도구: Antigravity로 하네스 워크플로우를 순차 실행, "다음"만 쳐서 기획 완성 - 핵심 깨달음: 아이디어만 명확하면 나머지는 AI가 채워준다 — 장르·주인공 나이만 정했을 뿐인데 세계관·대본·에셋까지 자동 생성 - 특별히 인상적이었던 것: 주인공 초상화 하나를 기준으로 전 씬 이미지의 얼굴을 일치시켜 주는 보정 기능 - 결과물: 단순 기획서가 아닌, 실제 영상 제작에 바로 투입할 수 있는 실사 이미지와 프롬프트 에셋 - 배운 교훈: 처음부터 완벽하게 기획하려 하지 말고, 일단 흐름을 타고 나서 내 맞춤으로 조정하면 된다 ## 🎯 이런 분들께 도움돼요 - 같은 스터디 22기 수강생 중 하네스를 아직 써보지 않은 분 - 숏폼 영상을 만들고 싶지만 기획 단계에서 막막한 초보 크리에이터 - AI 도구를 활용해 콘텐츠 제작 워크플로우를 체계적으로 구축하려는 분 ## 😫 문제 상황 (Before) 스터디에서 스터디장님이 설계한 '끌림영상 하네스' 시스템을 배웠습니다. 세계관 세팅부터 에피소드 기획, 대본, 이미지 프롬프트, 영상 프롬프트까지 — 숏폼 한 편을 만들기 위한 전체 워크플로우가 단계별로 정리되어 있는 시스템이었습니다. 기획이라는 게 원래 "세계관을 먼저 잡아야 하나? 대본부터 써야 하나? 이미지는 언제 만들지?" 이런 고민을 반복하다 보면 시간이 금방 지나가버리는데, 하네스 시스템을 AI 도구와 함께 돌려보니 이런 고민 자체가 사라졌습니다. ## 🛠️ 사용한 도구 - **도구명**: Antigravity (AI 코딩 에이전트) - **활용 방식**: 하네스 워크플로우를 순차적으로 실행하며 각 단계의 산출물을 자동 생성 - **특이사항**: 코드를 직접 작성하지 않고, 하네스에 정의된 규격과 템플릿을 따라 AI가 문서·이미지를 생성하는 방식 --- ## 🔧 작업 과정 ### 대시보드 띄우고 워크플로우 확인 — "아, 이 순서대로 하면 되는구나" 처음에는 하네스 프로젝트에 이미 만들어져 있는 대시보드를 띄워봤습니다. ``` 대시보드 만들어줄래? ``` AI가 새로 만들려고 해서 다시 말했습니다. ``` 아니, 기존 프로젝트의 대시보드 띄워달라는거야 ``` (모델을 클로드로 좋은걸 해야 잘 알아들음 ㅎㅎ) ``` 대시보드가 뜨니까 전체 워크플로우가 한눈에 보였습니다. 세계관 세팅(00) → 기초 에셋(0A) → 에피소드 기획(01) → 대본(02) → BGM(03) → 이미지(04) → 영상(05) → 검수(06). 이 순서대로 따라가면 되겠다는 감이 왔습니다. --- ### 00단계부터 시작 — "장르와 주인공만 정했을 뿐인데" ``` 워크플로우 순차대로 진행해보자 ``` AI가 세계관 세팅에 필요한 3가지를 물어봤습니다. 프로젝트 이름, 세계관 주제, 타겟 연령대. 편하게 답했습니다. ``` 1. 갑자기 판타지 세계로 2. 바쁜 30대 청년이 컴퓨터 게임을 하다가 갑자기 현실에서 판타지 세계로 빨려들어가서 그곳에서 생존하는 리얼 스토리 3. 2030 ``` 이것만으로 세계관 설정 문서, 프로젝트 메타데이터, 주인공 캐릭터 시트, 에피소드 기획서까지 한 번에 만들어졌습니다. 내가 정한 건 장르랑 주인공 나이뿐인데, 나머지는 하네스 규격에 맞춰 AI가 알아서 채워준 거죠. 여기서 "오!" 했습니다. 아이디어만 넣었을 뿐인데 하네스대로 빠르게 시나리오가 만들어지는 경험이었습니다. --- ### "다음"만 치면 진행되는 마법 — 대본, BGM, 이미지까지 가장 인상적이었던 건 그 다음부터였습니다. ``` 좋아 다음 ``` 이 한 마디면 다음 단계로 넘어갔습니다. 대본 작성, BGM 큐레이션, 이미지 프롬프트 명세까지. 각 단계에서 뭘 해야 하는지 고민할 필요가 없었습니다. 하네스에 이미 순서와 산출물 규격이 정해져 있으니까요. 실사 배경 이미지도 바로 요청했습니다. ``` 배경 이미지 실사로 만들어줘 ``` 이끼 낀 고대 숲, 안개가 자욱한 판타지 배경이 실사 느낌으로 뚝딱 나왔습니다. 이어서 각 씬별 스틸컷 이미지도 한 번에 요청했습니다. ``` 각 씬별 스타트 엔드 이미지 만들어줘 ``` 5개 씬의 시작 프레임과 끝 프레임, 총 10장의 실사 이미지가 만들어졌습니다. --- ### 캐릭터 얼굴 일치 보정 — "초상화 하나로 전 씬을 맞춰준다고?" 10장의 이미지가 나왔는데, 씬마다 주인공 얼굴이 조금씩 달랐습니다. 그래서 이렇게 요청했습니다. ``` 각씬 이미지의 인물 얼굴은 주인공 원본 이미지의 얼굴로 일치 시켜야해 ``` 주인공 초상화 이미지를 참조 기준으로 잡고, 10장 전부를 다시 생성해줬습니다. 이목구비, 헤어스타일, 분위기가 원본과 동일하게 고정됐습니다. 이 기능이 특히 인상적이었어요 — 영상에서 주인공이 씬마다 다른 사람처럼 보이면 안 되니까요. --- ### 같은 흐름으로 두 번째 시리즈도 — 20대 버전 빌드 30대 주인공 시리즈를 끝내고 나니, 같은 컨셉으로 20대 버전도 만들고 싶어졌습니다. ``` 코드베이스 분석해줘 새로운 영상 시리즈 만들려고해, 어떻게 시작할까? ``` ``` 1. 실제 현실 20대 청년이 컴퓨터 게임을 하다가 갑자기 판타지 실제 세계로 들어가서 생존하는 이야기 2. 너가 만들어줘 3. 너가 1번 시리즈 이름을 보고 판단해서 만들어줘 ``` 시리즈 이름은 "화면 밖은 판타지"로 자동 제안됐고, 주인공 '민우'의 캐릭터 시트까지 알아서 세팅. 이후 비율을 16:9 가로형으로 바꾸고, 실사 에셋 3종 생성, 대본 작성, 씬별 이미지 생성까지 — 첫 번째와 같은 흐름을 빠르게 반복했습니다. --- [모각에서 스터디장님이 하신것들을 보며 하나씩 진행] ### 3x3 변주 프롬프트 — "한 씬에서 여러 구도를 골라 쓸 수 있게" ``` 에피소드의 각씬당 3x3 프롬프트 만들 수 있어? ``` ``` 각 씬에 맞게 스타트, 엔드 이미지 3x3 프롬프트 작성해줄래? ``` ``` 16:9형으로 3x3으로 프롬프트 작성 ``` 씬마다 시작 프레임 3가지 안 × 끝 프레임 3가지 안 = 총 9가지 조합의 이미지 프롬프트가 만들어졌습니다. 20대 주인공 버전과 30대 주인공 버전 모두요. 여러 번 요청을 다듬어가며 영어 전용, 16:9 비율, 복사 가능한 형태로 정리했습니다. --- 스터디장님의 팁 : 챗지피티 덕테이프가 더 잘 만들어줍니다. --- ### 씬 구조 피드백 — "고블린 발견도 넣자" 만들어진 씬 구성을 보다가, 이야기 흐름에 빈 곳이 느껴졌습니다. ``` 아 처음에 눈을 뜨고, 일어나는데, 좀걸어가다가 고블린을 발견하는것도 빠르게 넣는게 좋을듯 ``` 이 한 마디로 양쪽 프로젝트(20대, 30대)의 에피소드 기획서, 씬 구조, 대본, 프롬프트, 체크리스트까지 한 번에 업데이트됐습니다. 중간중간 이런 식으로 암묵지의 디테일을 잡아야 하는 부분이 있는데, 진행하면서 내 맞춤으로 조정할 수 있겠다는 확신이 들었습니다. --- ### 대시보드에 결과물 시각화 마지막으로 만들어진 씬별 이미지들을 대시보드에서 바로 볼 수 있게 요청했습니다. ``` 씬별 이미지 대시보드에 넣어줘 ``` 씬 보드의 각 카드에 썸네일이 붙고, 클릭하면 상세 패널에서 크게 볼 수 있게 됐습니다. 각 씬의 기획 텍스트와 실사 이미지를 나란히 비교하면서 확인할 수 있으니 전체 흐름을 한눈에 파악할 수 있었습니다. --- ## ✅ 결과 (After) ### Before vs After | 항목 | Before | After | |------|--------|-------| | 기획 소요 시간 | 혼자 며칠은 걸릴 작업량 | 약 3시간에 2개 시리즈 완성 | | 기획 부담 | 뭘 먼저 해야 할지 고민 반복 | "다음"만 치면 진행, 고민 시간 거의 0 | | 산출물 수준 | 텍스트 기획서 정도 | 실사 이미지, 영상 프롬프트, 대본까지 바로 제작 투입 가능한 에셋 | | 캐릭터 일관성 | 씬마다 얼굴이 달라질 수 있음 | 초상화 기준으로 전 씬 얼굴 고정 | ### 결과물 - 2개 시리즈 프로젝트 (30대 주인공 "갑자기 판타지 세계로" + 20대 주인공 "화면 밖은 판타지") - 각 시리즈별: 세계관 설정, 캐릭터 시트, 에피소드 기획서, 대본, BGM 큐레이션 - 씬별 실사 시작/끝 프레임 이미지 (각 10장) - 3x3 변주 이미지/영상 프롬프트 매트릭스 - 대시보드에서 전체 진행 상황 시각화 ## 💬 이 과정에서 배운 AI 활용 팁 ### 효과적이었던 것 1. **아이디어만 명확하면 나머지는 AI가 채워준다** — 장르, 주인공 나이, 분위기 정도만 정하면 세계관·대본·에셋까지 알아서 생성됐습니다. 완벽한 기획안을 미리 짜서 전달할 필요가 없었어요. 2. **디테일은 진행하면서 잡아라** — 처음부터 완벽하게 기획하려고 하면 시작도 못 합니다. 일단 흐름을 타고, 결과물을 보면서 "고블린 발견도 넣자"처럼 한마디씩 피드백하면 자연스럽게 정교해집니다. 3. **워크플로우(하네스)가 있으면 AI 활용이 비약적으로 쉬워진다** — 매번 새 프롬프트를 고민하는 게 아니라, 정해진 단계를 따라 "다음"만 치면 됩니다. 이 차이가 정말 큽니다. ### 이렇게 하면 안 돼요 1. **의도를 모호하게 전달하면 AI가 다른 방향으로 간다** — "대시보드 만들어줘"라고 했더니 새로 만들려고 했습니다. "기존 대시보드 띄워줘"라고 명확하게 말해야 합니다. 2. **한 번에 모든 디테일을 잡으려 하지 마세요** — 암묵지의 디테일은 결과물을 보면서 잡는 게 훨씬 효율적입니다. ## 🌍 다른 업무에 적용한다면? 이 하네스 구조는 숏폼 영상뿐만 아니라, 단계별로 산출물이 정해져 있는 모든 콘텐츠 제작에 적용할 수 있을 것 같습니다. - **블로그 시리즈**: 주제 선정 → 아웃라인 → 초안 → 이미지 → 검수 워크플로우 - **유튜브 롱폼**: 기획서 → 대본 → 스토리보드 → 촬영 체크리스트 → 편집 가이드 - **마케팅 캠페인**: 컨셉 → 카피 → 비주얼 에셋 → 채널별 변형 핵심은 "단계를 미리 정해두고, AI에게 그 규격대로 채워달라고 하는 것"입니다. ## 🚀 앞으로의 계획 하네스를 내 맞춤으로 최적화할 예정입니다. 이번에 따라해 보면서 느낀 건, 전체 흐름은 훌륭한데 중간중간 암묵지의 디테일을 잡아야 하는 지점이 있다는 거였습니다. 예를 들어 캐릭터의 말투, 씬 전환의 리듬, 배경 분위기의 톤 같은 것들이요. 이런 부분들을 나만의 룰과 템플릿으로 정리해서, 다음에는 진짜 "다음"만 쳐도 내 취향에 맞는 결과물이 바로 나오도록 만들고 싶습니다. ## 📋 재사용 가능한 프롬프트 ### 프롬프트 1: 하네스 워크플로우 시작하기 > 워크플로우 순차대로 00부터 진행해보자. > [시리즈 이름]: [원하는 시리즈 이름] > [세계관]: [한 줄로 설명하는 세계관/주제] > [타겟 연령대]: [시청자 연령대] ### 프롬프트 2: 씬별 실사 이미지 + 얼굴 일치 요청 > 에셋 이미지 실사진으로 각각 만들어줘. > 각 씬별 스타트 엔드 이미지 만들어줘. > 각 씬 이미지의 인물 얼굴은 [주인공 초상화 경로]의 얼굴로 일치시켜야 해. ### 프롬프트 3: 3x3 변주 프롬프트 매트릭스 생성 > 각 씬에 맞게 스타트, 엔드 이미지 3x3 프롬프트 작성해줘. > [가로/세로] 비율로, 영어로만 복사할 수 있게 만들어줘.
    0
    1
  • Umji

    🎬 끌림영상 숏폼 제작 회고록: '생각 끄는 리모컨'

    1. 소개 시도하고자 했던 것과 그 이유 시도한 것: 머릿속 복잡한 잡생각을 강제로 종료시켜주는 가상의 아이템 '생각 끄는 리모컨'을 주제로 1분 분량의 유튜브 쇼츠/인스타 릴스를 기획하고 제작했습니다. 이유: 평소 생각이 많아 잠을 못 이루는 현대인들의 고충에 공감하여, 재미있고 귀여운 웹툰 스타일의 영상을 통해 소소한 웃음과 대리 만족을 전달하고 싶었습니다. 또한, 복잡한 영상 편집 툴을 직접 다루는 대신, AI 에이전트와 Remotion 기반의 자동화 하네스(Harness) 시스템을 활용해 이미지와 음성 파일만으로 완성도 높은 영상을 쉽게 뽑아내는 파이프라인을 검증해보고 싶었습니다. 2. 진행 방법 어떤 도구를 사용했고, 어떻게 활용하셨나요? ChatGPT (텍스트 및 이미지): '나나 점장'과 '모모 알바'라는 캐릭터 설정, 1~6번 씬으로 구성된 대본(01_script.md) 기획, 그리고 이미지 생성용 영문 프롬프트 추출 및 실제 이미지(.webp) 생성. 씬 번호 화면 묘사 (영상) 나레이션 및 대사 (음성) 화면 자막 S1 다크서클이 턱까지 내려온 모모 알바가 눈을 퀭하게 뜨고 서 있다. 나나 점장이 카메라를 보며 쉿! 하는 포즈를 취한다. 나나: "여러분, 어젯밤에도 꼬리에 꼬리를 무는 생각 때문에 밤새셨나요?" 어젯밤에도 생각하느라 밤새셨나요? S2 침대에 누워 뒤척이며 머리를 쥐어뜯는 모모 알바의 회상 장면. 모모: (피곤한 목소리) "아니, 자려고 눈만 감으면 이불킥 할 일만 생각난다니까요 ㅠㅠ" 눈만 감으면 이불킥 생각 폭발 ㅠㅠ S3 나나 점장이 품에서 '버튼이 딱 하나 있는 은빛 리모컨'을 짠! 하고 꺼낸다. 나나: "그래서 준비했습니다. 없는 물건 상점의 베스트셀러, '생각 끄는 리모컨'!" 베스트셀러 '생각 끄는 리모컨' S4 리모컨의 빨간 버튼을 꾹 누르는 나나 점장. 리모컨 끝에서 뿅! 하는 귀여운 빛이 나간다. 나나: "전원 버튼 하나면, 뇌 속의 복잡한 스위치를 딸깍! 꺼드립니다." 버튼 하나면 뇌 속 스위치가 딸깍! S5 빛을 맞은 모모 알바. 갑자기 눈동자에 초점이 사라지더니 천사 같은 미소를 지으며 선 채로 코를 곤다. 모모: "헤헤... (코 고는 소리 Zzz)" (평온 그 자체) Zzz... S6 자는 모모 알바를 보며 혀를 끌쯧 차는 나나 점장. 카메라를 보며 윙크한다. 나나: "단점: 다음 날 출근할 생각도 꺼져버릴 수 있음 주의. 원하시는 분은 지금 바로 댓글 남겨주세요!" 단점: 출근할 생각도 꺼짐 주의 😅 무료 TTS 툴 (클로바더빙): 작성된 대본을 복사해 넣어 각 씬에 맞는 음성 파일(.mp3) 생성. Hedra (립싱크 AI 툴): ChatGPT가 만들어준 정지 이미지와 TTS 음성 파일을 결합해, 캐릭터가 직접 입을 움직이며 말하는 동영상(.mp4)으로 변환. Node.js & Remotion (로컬 하네스): 생성된 이미지, 음성, 비디오 파일들을 outputs/ep01/ 폴더에 모아둔 뒤, npm run render 명령어를 통해 자막과 함께 하나의 완벽한 영상으로 자동 합성. 💡 활용한 주요 프롬프트 (Hedra 영상 생성용) 이미지 속 캐릭터가 대사에 맞춰 자연스럽게 표정을 짓도록 지시했습니다. 씬 1 (나나 점장) text Speaking naturally directly to the camera, friendly and slightly playful expression, blinking, realistic subtle head movements, making eye contact. 씬 2 (모모 알바) text Speaking with an exhausted and slightly frustrated expression, frowning slightly, tired eyes, complaining naturally, realistic subtle head movements. 🖼️ 활용 이미지 및 캡처 💻 활용한 코드 (자막 끄기 설정) 시스템에서 자동으로 띄워주는 자막이 필요 없을 때, project.json의 설정을 조작하여 자막을 껐습니다. json "elements": { "subtitles": { "enabled": false, "note": "가독성 좋고 귀여운 폰트를 활용한 자막 패키지" } } 3. 결과와 배운 점 배운 점과 나만의 꿀팁 파일 확장자 주의: 다운로드 받은 파일의 이름을 변경할 때 s01-voice.mp3.mp3 나 s01-video.mp4.mp4 처럼 확장자가 중복해서 붙지 않도록 윈도우 폴더 설정(확장자 표시)을 확인하는 것이 중요합니다! Hedra 꿀팁: 립싱크 영상을 만들 때 이미지와 음성만 넣어도 되지만, 짧은 프롬프트(예: friendly expression, blinking)를 추가하면 표정이 훨씬 자연스럽고 생동감 있게 나옵니다. Remotion 자동화의 편리함: 영상 소스들을 폴더에 이름만 맞춰 넣어두면, 수작업 편집(프리미어 프로 등) 없이 명령어 한 줄(npm run render)로 순서 배치와 렌더링이 자동으로 끝나는 것이 매우 신기하고 편리했습니다. 과정 중에 어떤 시행착오를 겪었나요? 윈도우 CMD 렌더링 충돌: npm run preview를 통해 웹 브라우저로 미리보기를 시도했으나, 윈도우 네트워크 설정(IPv6)과 Node.js 간의 충돌로 인해 EFAULT 에러가 발생했습니다. 이를 우회하기 위해 미리보기를 건너뛰고 바로 npm run render로 최종 .mp4 파일을 뽑아내는 방식을 택했습니다. 렌더링 버그 수정: 윈도우 CMD에서 spawn EINVAL 에러가 나서 렌더링이 안 되는 문제가 있었는데, 스크립트 코드(render_episode.mjs)에 shell: true 옵션을 부여하여 해결했습니다. 자막 끄기 버그: 분명 설정에서 자막을 껐음에도 강제로 자막이 그려지는 문제가 있었습니다. 원인을 찾아보니 템플릿 코드(SceneClip.tsx)에 하드코딩된 부분이 있어서, 설정값(subtitles.enabled)을 정상적으로 읽고 렌더링을 건너뛰도록 코드를 직접 수정해 해결했습니다. 도움이 필요한 부분이 있나요? 현재로서는 AI 에이전트의 도움을 받아 에러들을 모두 해결했기 때문에 막히는 부분은 없습니다! 앞으로의 계획 현재 1번, 2번 씬만 Hedra를 이용해 말하는 영상으로 만들었는데, 시간이 날 때 나머지 3~6번 씬도 모두 말하는 동영상으로 변환하여 100% 동적 영상으로 이루어진 퀄리티 높은 쇼츠를 완성할 예정입니다. 도움 받은 글 (옵션)
    0
    0
  • Flow 및 제미나이 이미지 생성활용 동영상 제작 기능 경험

    소개 나만의 동영상을 제작하기 위해 다양한 프로그램을 사용하여 내가 원하는 동영상의 결과물이 생성되도록 중간중간 하네스를 하여 제작하는 동영제작 경험 공유합니다. 진행 방법 동영상 제작을 위해 Flow를 사용하였다. 캐릭터 생성까지 Flow를 사용 하려고 했으나 이미지생성이 되지 않아 캐릭터 이미지는 제미나이를 이용했다. 에피소드01 에피소드01을 먼저 결과물을 보자는 생각으로 스터디장님(물결님)이 말씀주신데로 따라 했다. 세계관과 대사내용 모두 스터디장님(물결님)의 기존 프레임을 그대로 적용하였다. 소리를 처음에 어떻게 할지 몰라서 고민하다가 AI에 물어봐서 Typecast에서 회원가입후 무료이용 성우버전으로 했다. 다시 문제 발생, 동영상과 입모양 싱크가 안맞는 것이다. 그래서 결군 Flow에서 생성되는 목소리를 그대로 이용하였다. 자막 오버랩도 아직 사용법을 몰라 그대로 틀리데로 이용하였다. 에피소드02 에피소드01의 씬간의 동영상 길이 불일치 자막등의 불일치를 개선하고자 했다. Flow에 동영상 제작 프롬프트를 스터디장님(물결님) 안티그래비티 프로그램에 요청하였고 그대로 적용하였다. 모션그래픽, 캡션 서브타이틀 등이 제작 프로그램과 비슷하게 산출되어 좀더 자연스러워졌다. 여전히 목소리는 다른데서 조합하여 동영상과 싱크하는 방법은 몰라서 Flow에게 대사와 함께 동영상을 제작했고 그대로 이용했다. 에피소드03 에피소드03의 결과물 완성시간은 에피소드01, 02이 대비 획기 적으로 감축 되었다. 배경도 다른 사진을 써서 완성하였다. 씬간의 전환도 자연스럽게 구현된것을 확인할 수 있었다. 결과와 배운 점 처음 캐릭터 이미지 생성시 나는 아리아나 그란데를 너무 좋아해서 아리아나 그란데로 제작했다. 동영상제작을 위해 이미지를 이용하니 저작권문제 때문인지 에러가 발생해다. 실존인물은 악용을 방지하기 위해 구글에서 막는 것 같아 아쉬었다. 최대한 아리아나 그란데와 비슷한 이미지를 생성해 달라고 했으며 아리아나 그란데의 시그니처인 하이 포니테일을 적용해 달라고 해서 나만의 캐릭터를 생성했다. 다음으로 하고 싶은것은 외부에서 목소리를 가져와서 조합하는 것과 의상을 다른데서 입력받아 변환하는 동영상을 제작하고 싶다. 추가로 세계관을 스터디장님(물결님)이 만드신 안티그래비티 프로그램을 그대로 따라 생성했으나 나만의 스토리를 만들어서 제작 해보려고 한다.
    1
    0
  • 천안한마당

    영상은 만들어야 되는데 아이디어 생각하기가 더 힘들것 같다..

    ### 2주차 과제 ## 창의적인 영상 3분짜리 만들기 이번 과제에서는 AI를 활용하여 서로 다른 성격의 3분 분량 영상을 제작해보았습니다. ### 제작한 영상 #### 1. 6·25 전쟁 역사 영상 6·25 전쟁의 주요 사건들을 시청자들이 쉽고 흥미롭게 이해할 수 있도록 쇼츠 형식의 역사 콘텐츠로 제작하였습니다. 당시의 시대상과 전쟁의 긴박함을 실사 스타일 이미지와 영상으로 표현하는 데 중점을 두었습니다. #### 2. 미션임파서블 한마당 버전 기존 영화 「미션 임파서블」의 분위기를 패러디하여 제작하였습니다. 청소업체 캐릭터와 실제 업무를 접목해 첩보 영화처럼 연출했으며, 긴장감 있는 스토리와 액션 장면을 통해 재미 요소를 강화하였습니다. #### 3. 드래곤볼 오마주 영상 어린 시절 추억이 담긴 드래곤볼을 모티브로 제작하였습니다. 손오공, 크리링, 피콜로 등의 캐릭터가 등장하는 장면을 AI 이미지와 영상으로 구현해 보았으며, 향수를 불러일으키는 콘텐츠를 만드는 데 집중했습니다. --- ## 제작 과정에서 어려웠던 점 ### 1. 음악 제작의 어려움 가장 어려웠던 부분 중 하나는 영상에 어울리는 음악을 만드는 과정이었습니다. 원하는 분위기의 음악을 만들기 위해 원곡의 느낌을 참고해야 했는데, AI 음악 생성 도구에서 바로 원하는 스타일을 찾기가 쉽지 않았습니다. 그래서 유튜브에서 참고 음악을 재생한 후 직접 녹음하여 분위기를 분석하고, 이를 기반으로 Suno에 프롬프트를 입력해 비슷한 느낌의 음악을 제작했습니다. 이 과정을 통해 AI가 모든 것을 자동으로 만들어주는 것이 아니라, 사용자가 원하는 방향을 얼마나 구체적으로 제시하느냐가 결과물의 품질을 결정한다는 점을 느꼈습니다. ### 2. 효과음 찾기의 어려움 액션 장면이나 전쟁 장면에서는 효과음이 영상의 몰입도를 크게 좌우했습니다. 하지만 생각보다 원하는 효과음을 찾는 과정이 쉽지 않았습니다. 특히 폭발음, 기합 소리, 타격음, 긴장감을 주는 효과음 등을 찾는 데 많은 시간이 소요되었습니다. 이를 해결하기 위해 캡컷(CapCut)의 무료 효과음 라이브러리를 적극적으로 활용했고, 필요한 효과음을 찾기 위해 ChatGPT에 상황별 검색 키워드와 추천 효과음을 문의하며 작업을 진행했습니다. 그 결과 영상의 완성도가 크게 향상되었고, 효과음의 중요성을 다시 한번 체감할 수 있었습니다. ### 3. 음성 더빙의 한계 처음에는 등장인물들의 목소리까지 AI 더빙으로 넣어 더욱 완성도 높은 영상을 만들고자 했습니다. 하지만 여러 음성 생성 도구를 활용해 테스트해본 결과, 감정 표현이 다소 어색하거나 캐릭터와 목소리가 자연스럽게 어울리지 않는 경우가 많았습니다. 특히 드래곤볼과 같은 액션 장면에서는 실제 애니메이션 특유의 박진감이 충분히 전달되지 않았습니다. 그래서 최종적으로는 과도한 더빙보다는 음악과 효과음, 자막에 집중하는 방향으로 수정하였습니다. 향후에는 음성 합성 기술을 더 연구하여 보다 자연스러운 더빙에도 도전해보고 싶습니다. --- ## 느낀 점 이번 과제를 통해 AI를 활용하면 혼자서도 이미지, 영상, 음악까지 제작할 수 있다는 점이 매우 인상적이었습니다. 특히 예전에는 전문가들이 여러 프로그램을 사용해 만들던 작업을 이제는 다양한 AI 도구를 활용하여 비교적 짧은 시간 안에 구현할 수 있다는 점이 놀라웠습니다. 다만 좋은 결과물을 만들기 위해서는 단순히 AI를 사용하는 것보다 기획력, 스토리 구성 능력, 적절한 프롬프트 작성 능력이 더욱 중요하다는 사실을 배울 수 있었습니다. 앞으로도 역사 콘텐츠, 영화 패러디, 추억의 애니메이션 등 다양한 주제로 AI 영상 제작을 계속 시도해보며 더욱 완성도 높은 콘텐츠를 만들어보고자 합니다.
    2
    4
  • [suno-grok-capcut] Little Bird Dance

    소개 10여년 전 제작했던, 유아용 영어 콘텐츠 리뉴얼 진행 방법 suno 무료버전 - 기존에 가지고 있던 음원 업로드 하고, 클래식 버전으로 바꿈. suno에서 완성된 음원을 제미나이에 업로드 하여 노래 분석함. 3. 제미나이로 영상 제작 스토리 보드 작성함. 4.챗지피티에서 캐릭터와 배경 이미지 제작. 5. grok 에서 배경+캐릭터 이미지 참조하도록 하고 화면 설명+캐릭터 동선 프롬프트 넣어서 영상 순서대로 제작. capcut에서 전환효과+필터 추가하여 완성 결과와 배운 점 -영상작업은 시간과 돈이 많이 든다.ㅠㅠ -음원이 나오면, 음원분석(전주+가사+간주 등)에 시간을 많이 들여라. -초단위로 분석된 노래에 맞는 스토리보드(화면구성+캐릭터 동선)를 완벽하게 작성해라. -영상은 돈이다. 정확한 프롬프트로 치고 빠져라. [10년전 버전] https://youtu.be/L_leoejtjaY?si=FIKyeTfdD8ebkb2b [리뉴얼버전] https://youtu.be/1v8vRKlnmIM 앞으로의 계획 - 과거 콘텐츠 리뉴얼
    0
    1
  • 끌림 모각 모임 동영상 생성

    오늘 모여서 스터디장 샘에게 구글 플로우 하는 것을 많이 배웠습니다. 스터디장 샘의 캐릭터를 이용하여 검무를 하는 여성 이미지를 캐릭터를 생성한 이후 유튜브에서 검무를 하는 동영상을 검색하여 제미나이에 입력하여 동영상을 분석한 이후 캐릭터가 검무를 하는 동영상프롬프트 4개를 만들어달라고 했습니다. 하지만 1개는 구글 정책위반으로 생성하지 못했습니다. 만들어지 영상 3개를 합쳐서 스터디장 샘 앱을 이용하여 합쳐주고 리모션을 이용하여 자막을 달았습니다. 오늘 모임 매우 유익했습니다. ^https://files-us-east-1.t-cdn.net/files/bgqbIned1P8UJquHcjuPShttps://files-us-east-1.t-cdn.net/files/bNWovGUDRmU7a939uey6J ^
    0
    0
  • 오산타

    이렇게 했더니/내 생각 대로 되는 영상!/쉽게 가기

    소개 영상 제작시 애로사항 이었는데~ 이미지를 요청해 봅니다. -9개 정도의 씬을 함께 요청 가능하네요~ㅋ(이미지들을 연결하면 장편(?)의 영상도 가능하겠고~) -원하는것을 골랐는데,어떻게 요청하나?~~~번호!!!...(인식하네요/통하네요~ㅋ)... -사이즈 변경이 한번에 되네요ㅠ^^ https://chatgpt.com/share/6a1aa205-4184-83a4-b698-8658c3d95be5 이미지생성은 챗 GPT이미지2로~~~ 영상은 제미나이에서 했더니~ 이정도면 캡컷에서 음향과 효과,자막을 더해 완성도를 높여볼수 있겠네요! Tip: 사용한 프롬프트 전문을 꼭 포함하고, 내용을 짧게 소개해 주세요. Tip: 활용 이미지나 캡처 화면을 꼭 남겨주세요. Tip: 코드 전문은 코드블록에 감싸서 작성해주세요. ( / 을 눌러 '코드 블록'을 선택) (내용 입력) 결과와 배운 점 배운 점과 나만의 꿀팁을 알려주세요. -어렵게 가지말고 당장 쉽게 할수 있는것을 살펴보자! -자동화도 좋지만 흐름을 이해하여 지금 활용이 용이한것에 주목한다. 과정 중에 어떤 시행착오를 겪었나요. -안티그래피티의 편리함,영상 편집까지 직접 체함하고 있다. 도움이 필요한 부분이 있나요? -익숙해지는 과정에 함께 해요. 앞으로의 계획이 있다면 들려주세요. -실패사례들을 통해 익숙해지는 통로를 개척하렵니다^^ 도움 받은 글 (옵션) 5월30일 모각에서 함께 한 결과물이어서 감사드립니다! (내용 입력)
    0
    0
  • [22기 모각모임] 90분이면 GPT 이미지, 다 됩니다

    [지피터스 모각모임 후기] 뽀짝이한테 조각케이크 먹이려다 생긴 일들 한 줄 요약 ChatGPT 이미지 생성으로 gpters 마스코트 뽀짝이와 조각케이크를 합성해봤는데, 잘 될 줄 알았던 게 계속 안 됐고, 안 될 줄 알았던 게 갑자기 됐다. 왜 이걸 해봤냐면 사실 처음엔 거창한 목표 같은 건 없었어요. 모임에서 이미지 실습 얘기가 나왔고, 마침 뽀짝이 이미지가 눈에 들어왔고, "얘한테 케이크나 먹여볼까?" 싶었던 게 시작이었습니다. 근데 막상 해보니까 이게 단순히 "이미지 두 장 합치기"가 아니더라고요. 실제로 해본 과정 먼저 뽀짝이 이미지를 레퍼런스로 올리고 원샷 프롬프트부터 뽑았어요. 여기서 첫 번째 배운 점 — 프롬프트를 직접 처음부터 쓰려고 하면 막막한데, 이미지 보여주고 "이거 재현하려면 어떻게 쓰면 돼?"라고 물으면 훨씬 빠르게 출발점이 생긴다는 것. 그다음 뽀짝이 + 조각케이크 합성을 시도했는데, 여기서 예상 못 한 복병이 등장했어요. 뽀작이 특유의 통통하고 귀여운 실루엣은 잘 유지됐는데, 케이크가 자꾸 이상하게 뭉개지거나 뽀짝이 손이 케이크를 제대로 잡지 못하는 모양새가 나왔거든요. "먹는 모습"이라는 단어 하나로는 부족했던 거예요. 그래서 행동을 훨씬 구체적으로 바꿨어요. "두 손으로 조각케이크를 들고 한 입 베어무는 순간" 이런 식으로. 그랬더니 결과가 확 달라졌어요. 행동은 길게 묘사할수록 좋다는 거, 이때 처음 몸으로 느꼈습니다. 그다음엔 "이걸 그냥 합성 이미지가 아니라 광고처럼 만들고 싶다"는 욕심이 생겨서, ChatGPT한테 아예 아트디렉터 관점에서 뭘 고쳐야 하냐고 물어봤어요. 돌아온 피드백 중에 제일 기억에 남는 게 "지금은 캐릭터가 주인공이고 케이크가 소품인데, 광고라면 케이크가 주인공이어야 한다" 는 말이었어요. 같은 소재인데 위계가 달라지니까 완전히 다른 그림이 나왔습니다. 피드백 5개를 한꺼번에 다 반영했다가 오히려 결과가 산으로 간 경험도 했어요. 그 이후로는 딱 한두 개만 골라서 반영하는 식으로 바꿨는데, 이게 훨씬 안정적이었어요. 마지막으로 같은 콘셉트에서 구도만 바꿔 5장을 연속으로 뽑았는데, 이게 실무적으로 제일 쓸모 있겠다 싶었어요. 1장 완벽하게 만드는 것보다 변주 세트가 훨씬 활용도가 높더라고요. 솔직한 후기 중간에 작업 대화가 일부 날아가서 프롬프트 복원을 못 한 구간이 있었어요. 이미지는 있는데 어떻게 만들었는지 기억이 안 나는 상황 — 꽤 억울했습니다. 그 이후로 잘 나온 순간마다 프롬프트 바로 복붙해두는 습관을 들이게 됐어요. 생성보다 아카이빙이 더 중요할 수도 있다는 걸, 잃고 나서야 알았네요. 이 글을 읽는 분께 드리는 한 마디 뭔가 만들고 싶은 이미지가 있다면, 레퍼런스 한 장 들고 "이거 어떻게 만들어?"부터 시작해보세요. 프롬프트를 얼마나 잘 쓰느냐보다, 피드백 루프를 얼마나 빠르게 돌리느냐가 결국 결과물의 질을 결정하더라고요.
    2
    1
  • 진짜 쉽게 고퀄 사진 뽑아내는 법 강의 듣고 바로 실천

    소개 왜 내가 뽑는 이미지는 늘 구린걸까? 도대체 다른 사람들은 어떤 도구를 썼길래? 진행 방법 어떤 도구를 사용했고, 어떻게 활용하셨나요? chat gpt (team 요금제), 결과물에서부터 prompt를 뽑아내는 역설계 방식 Tip: 사용한 프롬프트 전문을 꼭 포함하고, 내용을 짧게 소개해 주세요. 1) 레퍼런스 이미지를 전달하면서, 이런 이미지를 생성하려면 어떤 프롬프트를 써야 해? 2) 받은 프롬프트를 입력 추천 프롬프트 재미있는 캐리커처풍의 의인화 동물 캐릭터를 그려줘. 얼굴은 영리하고 장난기 있는 여우 얼굴이며, 큰 반짝이는 애니메이션 눈, 살짝 올라간 눈썹, 자신감 있는 미소를 갖고 있다. 캐릭터는 창의적인 전략가이자 아이디어 메이커처럼 보이며, 손에는 펜과 작은 노트를 들고 있다. 시각 스타일은 1990년대 일본 셀 애니메이션풍으로, 깨끗하고 선명한 검은 라인아트, 평평하지만 풍부한 색면, 섬세한 머리카락과 털 묘사, 큰 눈의 반짝이는 하이라이트, 부드럽고 낭만적인 판타지 분위기. 캐릭터 뒤에는 넓고 아름다운 흰 날개가 펼쳐져 있고, 주변에는 아이디어를 상징하는 작은 빛, 별, 종이 메모, 캠페인 스케치, 마법진 같은 그래픽 요소가 떠 있다. 배경은 밝은 하늘과 푸른 정원이 보이는 몽환적인 판타지 공간. 전체 분위기는 귀엽고 지적이며, 약간 신비롭고 유머러스하다. 구도는 상반신 중심의 캐릭터 포스터, 역동적인 날개 실루엣, 선명한 색감, 고전 애니메이션 오프닝 장면 같은 느낌. 텍스트는 넣지 않는다. 좀 더 전문가식으로 다듬으면 이렇게 갈 수 있어. 고급 버전 An original anthropomorphic fox caricature character, clever, playful, and charismatic, portrayed as a creative strategist. The fox has large sparkling anime eyes, expressive eyebrows, a sly but friendly smile, orange-and-white fur, and slightly exaggerated caricature proportions. The character wears a smart-casual outfit with a light jacket and holds a pen and notebook, suggesting ideas, planning, and creative problem solving. Visual style: nostalgic 1990s Japanese cel animation aesthetic, crisp dark linework, clean hand-painted color blocks, soft airbrushed highlights, elegant flowing shapes, romantic fantasy atmosphere, bright expressive eyes, graceful feathered angel wings spread widely behind the character. Surround the character with floating idea notes, small stars, magical sparkles, campaign sketch symbols, and subtle strategy diagrams, but no readable text. Background: luminous blue sky, soft garden greenery, dreamy palace-like shapes blurred in the distance. Mood: whimsical, intelligent, warm, mythic, charmingly humorous. Composition: centered upper-body character poster, dramatic wing silhouette, polished vintage anime key visual, clean background, vibrant but gentle colors, highly expressive face, no text, no logo, no watermark. 네거티브 프롬프트도 같이 넣는 게 좋아. photorealistic, 3D render, western comic style, gritty texture, dark horror mood, messy linework, over-detailed background, readable text, logo, watermark, extra fingers, distorted hands, deformed wings, realistic animal face, scary expression 내가 전문가라면 핵심 지시어는 이렇게 잡을 것 같아: “1990s Japanese cel animation fantasy key visual + anthropomorphic fox strategist + angel wings + no text + clean line art + big sparkling eyes.” Tip: 활용 이미지나 캡처 화면을 꼭 남겨주세요. Tip: 코드 전문은 코드블록에 감싸서 작성해주세요. ( / 을 눌러 '코드 블록'을 선택) (내용 입력) 결과와 배운 점 배운 점과 나만의 꿀팁을 알려주세요. 과정 중에 어떤 시행착오를 겪었나요? 도움이 필요한 부분이 있나요? 앞으로의 계획이 있다면 들려주세요. 프롬프트를 추천해달라는 팁은 이미 알고 있었지만, 활용을 거의 안 하고 있었다. 그런데, 이미지를 보내주고, 그 이미지를 만들기 위한 prompt를 역으로 물어보는게 강력하다는 걸 알았다. 예전 방식 : 그냥 이미지를 주고, 이 것과 비슷하게 만들어줘 개선된 방식 : 이런 이미지를 만들고 싶은데, 어떤 프롬프트를 써야 하나요? -> 실제로 받은 프롬프트를 전달 -> 그 후에 개선사항 요청 -> 맘에 안들면 '전문가 소환' -> 맘에 들면 대량 생성 추후 과제 : 레퍼런스 이미지를 미리 찾아보는 것도 필요하다. 그래서 고수들이 '핀터레스트'를 쓰는 걸까? 인스타그램도 있고 마지막짤 - 뽀짝이와 도움 받은 글 (옵션) 참고한 지피터스 글이나 외부 사례를 알려주세요. (내용 입력)
    0
    0
  • 제온_

    Seedance 중심 | 웹툰·애니메이션 제작 현장의 관점

    미리보기 Seedance로는 어느 정도까지 만들 수 있을까? 아래 영상은 실제 Seedance로 제작한 결과물입니다. AI 영상 제작 실무 노트 Seedance 중심 | 웹툰·애니메이션 제작 현장의 관점 도입 왜 Seedance인가? Grok, Omni, 로컬 모델 등 더 저렴하거나 접근하기 쉬운 선택지가 있는데 — 그럼에도 Seedance를 선택하는 이유가 있습니다. 조금 다른 각도에서 이야기해볼게요. 실무에서 비용이란 = 돈 + 시간 단가가 낮은 모델을 써서 원하는 컷 하나를 뽑을 때까지 수십 번 트라이하면, 그 시간 자체가 제작비입니다. 특히 연재 중인 작품에는 최저 연재선 — 반드시 맞춰야 할 마감 — 이 존재하고, 러닝타임과 제작 기간은 항상 빡빡합니다. 운에 기대는 방식 다수 트라이 → 시간·크레딧 낭비 Seedance 방식 확실한 연출 → 프롬프트 이해도 = 퀄리티 Seedance의 결정적 강점 배경 일관성이 압도적 — 씬이 바뀌어도 동일한 공간감, 색감, 광원이 유지됨 그림체(캐릭터) 일관성도 타 모델 대비 안정적 프롬프트 지시에 대한 이해도가 높아 예측 가능한 결과물 도출 납품급 퀄리티를 목표로 할 때 제작비 관점에서 가장 효율적 AI 영상으로 납품급 결과물을 만들고자 한다면, "단가 낮은 모델 × 많은 시도"보다 "Seedance × 정밀한 프롬프트"가 실질 비용이 더 낮습니다. 🎤 Grok 관련 내용은 스터디에서 많이 다룰 예정이라, 여기서는 현장 관점에서 짧게 짚고 넘어갑니다. 실무 포인트 일관성(Consistency)이 핵심인 이유 그림체 일관성 = 작품의 신뢰도 시청자나 독자는 캐릭터의 얼굴이나 배경이 컷마다 달라지면 바로 몰입이 깨집니다. 웹툰 원작 기반 애니메이션에서는 특히 원작 독자들의 기준이 높아, 일관성 하나만으로도 작품 신뢰도가 크게 달라집니다. 캐릭터 시트 제작 캐릭터의 외형·의상·표정 등을 고정하는 레퍼런스 시트를 먼저 만들고, 이를 Seedance에 Reference ID로 등록해 일관성을 확보합니다. 설정 영상 제작 캐릭터 시트 겸 목소리 일관성을 위한 설정 영상도 제작 — 향후 VO·더빙 작업의 기준점이 됩니다. AI 툴 한계 & 디자이너의 역할 AI가 잘 하는 것 vs 사람이 필요한 것 ChatGPT 등으로도 일정 이상의 퀄리티는 나옵니다. 하지만 상용화 애니메이션의 경우, 1차 디자인 단계에서 AI 티를 줄이는 작업이 반드시 필요합니다. 차별화가 필요한 이유 AI가 생성하는 이미지에는 특유의 패턴·질감·구도가 있어서, 다른 작품들과 나란히 놓으면 "AI로 만들었구나" 하고 바로 눈에 띕니다. 상업적으로 시장에 내놓을 때는 이 지점에서 반드시 디자이너의 손을 거쳐야 합니다. 현실적인 워크플로우 AI로 초안·러프를 빠르게 생성 디자이너가 AI 특유의 어색함을 걷어내고 작품 고유의 화풍으로 다듬기 최종 레퍼런스 확정 후 다시 AI 파이프라인에 투입 정리 오늘의 핵심 포인트 AI 영상 제작에서 시간 = 비용 — 저렴한 모델도 트라이가 많으면 결국 비쌉니다 Seedance의 강점은 배경·그림체 일관성과 프롬프트 이해도 납품급 목표라면 제작비 관점에서 Seedance가 유리한 선택 캐릭터 시트 + 설정 영상으로 일관성의 기준점을 먼저 잡아야 함 AI는 좋은 도구지만, 상업화 단계에서는 디자이너의 판단과 손길이 반드시 필요 결국 AI는 "운을 줄이고 확률을 높이는 도구"입니다. 프롬프트를 이해하고, 연출 의도를 명확하게 가져갈수록 — AI의 성능을 온전히 뽑아낼 수 있습니다. Seedance그림체 일관성배경 일관성캐릭터 시트제작비 관점디자이너 협업프롬프트 이해도납품급 퀄리티 예상 Q&A 질문이 나올 것 같은 것들 Q1 Grok이나 다른 모델도 계속 업데이트되고 있잖아요. 그냥 Grok 써도 되지 않나요? A 맞습니다, Grok도 잘 되는 장면들이 분명히 있어요. 다만 현장에서 핵심은 같은 공간이 컷마다 동일하게 유지되는가, 캐릭터의 외형이 흔들리지 않는가 — 이 두 가지입니다. 작품의 퀄리티 유지를 위해 Seedance를 선택하는 건 그 때문이에요. 개인 작업이나 테스트 단계에서는 Grok을 충분히 활용해볼 수 있지만, 납품이 걸린 프로젝트라면 안정성이 검증된 툴을 쓰는 게 낫습니다. 이건 어디까지나 현재 기준 제 개인적인 의견이고, 모델들이 계속 빠르게 발전하고 있으니 앞으로 달라질 수도 있습니다. Q2 프롬프트를 잘 짜야 한다고 하셨는데, 처음에는 어디서부터 시작해야 할까요? A 가장 먼저 해야 할 건 캐릭터 레퍼런스를 고정하는 겁니다. 캐릭터 시트 없이 씬 프롬프트부터 짜면 컷마다 얼굴이 달라지거든요. 레퍼런스 ID나 이미지를 먼저 세팅하고, 그 다음에 카메라 앵글 / 조명 / 배경 분위기 순서로 구체화해 나가시면 됩니다. 처음엔 짧고 단순하게 짜고, 잘 안 나오는 부분만 조건을 추가하는 방식이 감을 잡는 데 가장 빠릅니다. Q3 디자이너가 없는 소규모 팀이나 개인 작업자라면 AI 티를 어떻게 줄일 수 있을까요? A 완전히 없애기는 어렵지만, 현실적인 방법이 있습니다. 스타일 레퍼런스 이미지를 잘 고르는 것인데, 원하는 화풍의 일러스트를 인풋으로 넣으면 AI 특유의 기본값에서 벗어나는 데 도움이 됩니다. 당장 디자이너를 쓸 수 없는 단계라면 이 방법이 가장 현실적인 선택입니다. 그 외 질문 사항이 있으시면 답변 드리겠습니다. 감사합니다.
    2
    2
  • 별찾아서

    1주차 간단한 캐릭터 영상 만들기

    소개 시도하고자 했던 것과 그 이유를 알려주세요. 예전에 만들었던 이미지를 재활용해서 귀여운 캐릭터 콘텐츠 영상을 만들고자 했어요. 진행 방법 예전에 미드저니에서 만들었던 펠트 천 느낌의 귀여운 캐릭터를 참고해서 귀여운 캐릭터를 GPT Image 2.0 에서 이미지 생성했어요. 다음 이미지는 예전에 미드저니에서 만든 펠트 천 느낌의 캐릭터 이미지입니다. 다음 이미지는 기존 이미지를 참고해서 GPT Iamage 2.0 에서 생성한 캐릭터시트 이미지 GPT 에게 부탁해서 간단한 30초 시나리오 스토리를 부탁해서 받았어요. 시댄스 2.0에 참고이미지를 주고 간단한 영상 생성해서, 영상편집 도구에서 영상을 이어 붙여서 완성했어요. 결과와 배운 점 GPT Image 2.0 에서 캐릭터 시트이미지 생성이 꽤 괜찮게 나온 것 같고, 시댄스는 캐릭터 이미지의 특징을 잘 잡아서 쉽게 영상으로 만들어 주었네요. 1주차에 개인사정이 겹쳐서 스터디에 참여를 못했는데, 2주차부터는 스터디에 열심히 참여해보겠습니다.
    1
    2
  • 천안한마당

    1주차 최종정리 : 캐릭터부터 영상까지 완성

    시도하고자 했던 것과 그 이유 [1. 회사의 캐릭터 생성] 뽀짝이 캐릭터를 활용해 저희 회사만의 캐릭터 콘텐츠를 제작해보았습니다. 실제 청소업체 직원 사진을 그대로 사용하는 경우 너무 광고처럼 보일 수 있다고 판단해, 보다 친근하고 귀여운 느낌의 동물 캐릭터 5인조를 제작하게 되었습니다. 단순 홍보가 아니라 사람들이 재미있게 보고 기억할 수 있는 콘텐츠를 만들고 싶었고, AI를 활용하면 캐릭터·음악·영상까지 하나의 세계관처럼 제작할 수 있다는 점이 흥미로웠습니다. [2. 토옵이님이 공유해 준 자료 실습] 실제 동물들이 요리를 하는 영상 제작 (젬이 제대로 인식을 못함) 캡컷으로 영상 편집 방법 실습 그록을 슈퍼그록으로 업그레이 챗지피티로 나만의 가사를 만들어서 SUNO에서 노래제작 [3. 유튜브 채널 업그레이드] 스토리보드를 사용하여 일관성 있게 한국사 업그레이드 6 25 전쟁이야기도 게시하기 시작함 도구 활용과 진행 방법 사용한 도구와 활용 방식 ChatGPT 캐릭터 이미지 생성, 스토리보드 구성, 장면 연출 프롬프트 제작에 활용했습니다. 귀여운 동물 캐릭터들의 표정, 포즈, 배경 분위기를 구체적으로 설정하며 이미지 제작을 진행했습니다. Codex ChatGPT에서 만든 스토리보드 이미지를 한 장씩 분리하기 위해 코드를 작성해 활용했습니다. 여러 컷으로 구성된 이미지를 영상 제작용으로 잘라내는 작업을 자동화했습니다. Suno 캐릭터 분위기에 맞는 음악 3곡을 제작했습니다. 밝고 중독성 있는 느낌의 음악을 생성해 쇼츠 영상 분위기를 살렸습니다. Grok ChatGPT에서 생성한 이미지를 기반으로 움직이는 영상으로 제작했습니다. 캐릭터들이 실제로 춤추고 움직이는 느낌을 표현하는 데 활용했습니다. CapCut 완성된 영상과 음악을 합쳐 최종 쇼츠 영상으로 편집했습니다. 자막, 화면 전환, 효과음 등을 추가해 완성도를 높였습니다. 결과와 배운 점 배운 점과 나만의 꿀팁 처음에는 영상을 먼저 제작한 뒤 음악을 맞추는 방식으로 작업했는데, 영상 길이와 음악 타이밍을 맞추는 과정이 생각보다 어려웠습니다. 그래서 이후에는 음악 길이를 먼저 정한 뒤 장면 수를 구성하는 방식이 훨씬 효율적이라는 점을 배웠습니다. 또한 스토리보드를 한 장 이미지로 만든 뒤 코덱스로 잘라 사용하는 과정에서 화질 저하가 발생했는데, 중요한 장면은 다시 개별 생성하여 해결했습니다. 특히 AI 영상 제작에서는: “장면 수 → 음악 길이 → 컷 구성” 순서로 작업하면 훨씬 편했고, 처음부터 고해상도로 이미지를 생성하는 것이 매우 중요했습니다. 시행착오 영상과 음악 길이가 맞지 않아 수정 작업이 반복됨 비버를 자꾸 곰으로 인식함 스토리보드 이미지를 분할하는 과정에서 화질 저하 발생 일부 장면은 움직임이 어색해 여러 번 재생성 필요 캐릭터 얼굴이 장면마다 달라지는 문제도 있어 프롬프트를 계속 수정함 도움받고 싶은 부분 캐릭터 일관성을 유지하는 방법 더 자연스러운 AI 영상 움직임 제작 방법 유튜브 쇼츠 알고리즘에 맞는 영상 구성 방식 해외 시청자 대상 쇼츠 제작 노하우 앞으로의 계획 앞으로는 단순한 캐릭터 영상이 아니라, 5인조 캐릭터 세계관을 기반으로 한 쇼츠 시리즈를 계속 제작해볼 계획입니다. 특히 병원·청소·일상 등을 너무 광고처럼 표현하기보다는, 사람들이 재미있게 보면서 자연스럽게 브랜드를 기억할 수 있는 방향으로 발전시키고 싶습니다. 또한 AI 영상 제작 툴들을 계속 연구하면서, 더 자연스럽고 퀄리티 높은 애니메이션 스타일 쇼츠 제작에도 도전해볼 예정입니다.
    0
    2
  • 에이아잇커서너

    가칭 "한턱쏴줘" 작곡 및 동영상 제작기 - ChatGPT + Suno + Grok + 킥컷

    # Suno + Grok을 활용한 AI 코믹 뮤직비디오 제작 과정 ## 소개 ### 시도하고자 했던 것과 그 이유를 알려주세요. 이번에 시도한 것은 **Suno로 만든 4분 55초짜리 코믹 음악을 바탕으로 Grok 이미지/영상 생성용 프롬프트를 제작하는 작업**입니다. 노래의 주제는 **성과급을 많이 받은 하이닉스 친구에게 한턱을 내게 하려는 직장인의 처절한 부탁**입니다. 처음에는 성과급 뉴스와 주변 사람들의 이야기에 질투심과 자괴감을 느끼지만, 후반부로 갈수록 분위기가 밝아지고 결국 친구를 축하하면서 **“한턱 쏴!”** 를 외치는 신나는 회식장 분위기로 전환되는 내용입니다. 이 작업을 하려는 이유는 단순히 노래만 만드는 것이 아니라, 노래에 맞는 **캐릭터 이미지**, **뮤직비디오 장면 구성**, **10초 단위 영상 프롬프트**까지 만들어서 하나의 짧은 AI 뮤직비디오처럼 완성해보고 싶었기 때문입니다. --- ## 진행 방법 ### 어떤 도구를 사용했고, 어떻게 활용하셨나요? 사용한 도구는 크게 두 가지입니다. 첫째, **Suno**를 사용해서 노래를 만들었습니다. 처음에는 처절한 피아노 발라드처럼 시작하고, 후반부에는 드럼, 베이스, 일렉기타, 신스가 추가되면서 신나는 트로트 록 / 페스티벌 팝 분위기로 전환되도록 설정했습니다. 둘째, **Grok 이미지/영상 생성**을 활용하기 위해 캐릭터별 이미지 프롬프트와 10초 단위 영상 프롬프트를 작성했습니다. 전체 영상은 4분 55초였지만, Grok에서는 10초 영상 단위로 만들기 위해 핵심 장면을 25개로 나누었습니다. 등장인물은 총 4개 그룹으로 설정했습니다. 1. 메인 주인공 2. 하이닉스에 다니는 친구 3. 주인공의 아내 4. 회사 동료 / 회식 멤버 단체 캐릭터 이미지는 영상 전체에서 반복적으로 사용해야 하므로, 모두 **눈이 크고 귀여운 캐릭터 스타일**로 통일했습니다. 현실적인 인물보다는 코믹하고 친근한 느낌이 살아나도록 구성했습니다. --- ## 사용한 Suno 프롬프트 전문 ```text Korean song, starts as a very sad dramatic piano ballad with desperate male vocal, comic jealousy and pleading mood. The singer begs his SK Hynix friend to treat him after receiving a huge performance bonus. Lyrics should feel painfully desperate at first, talking about hearing Hynix bonus news everywhere, at home from his wife and at work from coworkers, until his ears feel like bleeding. After the first chorus, gradually add drums, bass, electric guitar, and synth. The mood transforms from sad ballad into upbeat Korean trot rock / festival pop. The second half becomes funny, energetic, and catchy, like everyone at a company dinner chanting together. Theme: jealousy, friendship, performance bonus, asking for a dinner treat, but finally realizing he still loves his own job, home, family, and wants to love himself more. Mood progression: 1. Intro: slow piano, desperate spoken vocal 2. Verse 1: sad emotional ballad 3. Chorus 1: pleading and pathetic 4. Verse 2: beat slowly enters 5. Chorus 2: brighter and funny 6. Bridge: warm emotional reflection about family and self-love 7. Final chorus: explosive upbeat festival chant, everyone shouting “한턱 쏴!” Style: Korean dramatic ballad intro, emotional male vocal, humorous lyrics, gradual build-up, upbeat trot rock, festival pop, crowd chant, catchy chorus, warm ending, 3 minutes. Grok 이미지 생성을 위한 공통 스타일 프롬프트 Create a cute Korean music video character concept art. Big sparkling eyes, adorable facial expression, soft rounded face, charming cartoon-realistic style, clean colorful illustration, high detail, warm lighting, expressive comedy-drama mood, 9:16 vertical portrait, full body character design, no real company logos, no copyrighted brand logos. 캐릭터 1. 메인 주인공 프롬프트 Create a cute Korean male office worker character for a comedy music video. He is in his late 40s, average build, short black hair, slightly tired but adorable face, very big expressive eyes, soft rounded cheeks, funny desperate expression. He wears a slightly wrinkled white office shirt, loosened navy tie, black slacks, and office shoes. He looks jealous, pathetic, but lovable, holding a smartphone as if waiting for his friend's message. His mood is comic desperation, like he wants to beg his friend to buy dinner. Cute cartoon-realistic style, big sparkling eyes, warm cinematic lighting, 9:16 vertical full body portrait, no real logos. 짧은 설명 성과급을 받은 친구가 부러워 연락은 못 하고, 한턱을 기다리는 주인공입니다. 표정은 처절하지만 귀엽게 표현합니다. 캐릭터 2. 하이닉스 다니는 친구 프롬프트 Create a cute Korean male semiconductor company employee character for a comedy music video. He is in his late 40s, neat and confident, friendly smile, very big sparkling eyes, soft rounded face, clean short black hair. He wears a clean business casual outfit, light blue shirt, navy blazer, neat slacks, and an employee ID card without any real logo. He looks successful but kind, holding a glowing bonus envelope and a shiny credit card. His expression is proud, generous, and slightly embarrassed because everyone is asking him to treat them to dinner. Cute cartoon-realistic style, adorable character design, warm bright lighting, 9:16 vertical full body portrait, no real company logos. 짧은 설명 성과급을 받은 친구입니다. 너무 얄미워 보이지 않게, 성공했지만 착하고 귀여운 이미지로 잡았습니다. 캐릭터 3. 주인공의 아내 프롬프트 Create a cute Korean wife character for a warm comedy music video. She is in her 40s, kind but sharp and realistic, big sparkling eyes, soft rounded face, gentle smile with a slightly teasing expression. She wears comfortable home clothes, a cozy cardigan, and holds a smartphone showing generic bonus news without real logos. She sits at a warm dinner table, casually talking about performance bonuses while her husband looks shocked. Cute cartoon-realistic style, warm home lighting, adorable facial expression, 9:16 vertical full body portrait, no real logos. 짧은 설명 집에서 성과급 이야기를 꺼내 주인공을 더 괴롭게 만드는 인물입니다. 하지만 후반부에는 가족의 따뜻함을 보여주는 역할도 합니다. 캐릭터 4. 회사 동료 / 회식 멤버 단체 프롬프트 Create a cute group of Korean office coworkers for a comedy music video. A small group of 4 to 6 office workers, mixed men and women in their 30s to 50s, all with big sparkling eyes, rounded cute faces, expressive funny reactions. They wear office shirts, blazers, cardigans, and employee ID cards without real logos. In the first mood, they gossip excitedly about huge performance bonuses around a coffee machine. In the second mood, they happily clap and chant “한턱 쏴!” at a Korean barbecue restaurant. Cute cartoon-realistic style, cheerful group character design, warm colorful lighting, 9:16 vertical composition, no real company logos. 짧은 설명 회사에서 성과급 이야기를 반복하는 동료들이며, 후반부에는 회식장에서 “한턱 쏴!” 를 떼창하는 단체 캐릭터입니다. Grok 10초 영상 제작 방향 전체 영상은 다음과 같은 흐름으로 나누었습니다. 구간 영상 번호 분위기 처절한 발라드 인트로 01~04 어둡고 느림, 질투와 자괴감 성과급 소음 지옥 05~07 집, 회사, 뉴스에서 성과급 이야기 반복 첫 번째 애원 08~10 불쌍하고 코믹하게 부탁 비트 진입 11~14 슬픔에서 리듬감으로 변화 가족과 자기 회복 15~16 따뜻한 감정 회복 밝은 후렴 전환 17~21 웃기고 신나는 음식 판타지 회식장 떼창 피날레 22~25 축제, 떼창, 한턱 쏴 엔딩 Grok 영상용 공통 프롬프트 Vertical 9:16 Korean comedy music video style. Use cute cartoon-realistic characters with big sparkling eyes and adorable expressions. The main character is a Korean male office worker in his late 40s, tired but lovable, wearing a white shirt and loosened navy tie. The mood starts as a sad dramatic piano ballad and gradually transforms into upbeat Korean trot rock and festival pop. Cinematic lighting, expressive acting, funny but warm story, no real company logos, no copyrighted brand logos. Grok 영상용 네거티브 프롬프트 Avoid real company logos, avoid real brand names on screen, avoid distorted hands, avoid unreadable faces, avoid scary gore, avoid dark violence, avoid political content, avoid celebrity likeness. Keep it cute, funny, warm, cinematic, and music-video-like. 4분짜리 영상과 노래는 킷컷으로 그냥 합쳤습니다. 별다른 기술을 안부리구요 ^^ 결과와 배운 점 배운 점과 나만의 꿀팁을 알려주세요. 이번 작업을 하면서 가장 크게 배운 점은 노래 → 캐릭터 → 장면 → 영상 프롬프트 순서로 가야 결과물이 훨씬 안정적으로 나온다는 점입니다. 처음부터 바로 영상을 만들려고 하면 장면마다 인물이 달라지거나 분위기가 흔들릴 수 있습니다. 그래서 먼저 등장인물을 정하고, 각 인물의 외형과 성격을 고정한 뒤, 영상 프롬프트에 같은 캐릭터 설명을 반복해서 넣는 것이 중요했습니다. 나만의 꿀팁 캐릭터를 먼저 만든다 영상보다 캐릭터 이미지를 먼저 만들어야 전체 뮤직비디오의 통일감이 좋아집니다. 공통 스타일 문장을 반복해서 넣는다 big sparkling eyes, cute cartoon-realistic style, no real logos 같은 문장을 계속 넣으면 스타일이 흔들리지 않습니다. 음악 분위기 전환을 영상 색감으로 표현한다 초반은 어두운 파랑/회색 톤, 중반은 따뜻한 노란 조명, 후반은 빨강/노랑 회식장 조명으로 잡으면 음악의 전환이 영상에서도 잘 보입니다. 실제 회사 로고는 피한다 특정 회사 이름은 노래 가사나 콘셉트에는 들어갈 수 있지만, 이미지나 영상에서는 실제 로고를 노출하지 않고 large Korean semiconductor company처럼 표현하는 것이 안전합니다. 과정 중에 어떤 시행착오를 겪었나요? 처음에는 단순히 노래 가사만 만들면 충분할 것이라고 생각했습니다. 하지만 실제로 영상을 만들려고 하니 노래 길이, 장면 수, 캐릭터 통일성 문제가 생겼습니다. 특히 4분 55초 영상을 10초 단위로 나누면 약 29개 장면이 필요하지만, Grok 작업 효율을 위해 핵심 장면만 뽑아 25개 장면으로 압축했습니다. 이 과정에서 모든 가사를 그대로 영상화하기보다는, 노래의 핵심 감정선인 질투 → 처절한 부탁 → 자기 회복 → 신나는 한턱 떼창을 중심으로 구성했습니다. 또한 처음에는 인물들이 너무 현실적으로 보일 수 있어서, 이후에는 눈이 크고 귀여운 캐릭터 스타일을 추가했습니다. 이렇게 하니 처절한 내용도 너무 무겁지 않고, 코믹한 뮤직비디오 분위기가 살아날 수 있다고 판단했습니다. 도움이 필요한 부분이 있나요? 앞으로 실제 Grok에서 이미지를 생성한 뒤, 캐릭터가 일정하게 유지되는지 확인이 필요합니다. 만약 장면마다 얼굴이 달라진다면, 캐릭터별 기준 이미지를 먼저 만든 후 그 이미지를 참조 이미지로 사용해서 영상 프롬프트를 다시 조정할 필요가 있습니다. 또한 Suno에서 나온 음악의 실제 구간별 분위기에 맞춰, 25개 영상 장면의 순서를 조금 더 세밀하게 조정하면 완성도가 올라갈 것 같습니다. 앞으로의 계획이 있다면 들려주세요. 앞으로는 다음 순서로 작업할 계획입니다. Grok에서 4명의 캐릭터 기준 이미지를 먼저 생성 마음에 드는 캐릭터 이미지를 고정 10초짜리 영상 25개를 순서대로 생성 CapCut 또는 편집 프로그램에서 Suno 음악과 영상 싱크 맞추기 초반은 처절하게, 후반은 회식장 축제처럼 보이도록 자막과 효과음 추가 마지막 장면에 “예약은 내가, 계산은 네가” 코믹 엔딩 삽입 최종 목표는 AI 노래 + AI 캐릭터 + AI 영상 프롬프트를 결합한 짧은 코믹 뮤직비디오 완성입니다. 도움 받은 글 참고한 지피터스 글이나 외부 사례를 알려주세요. 이번 작업은 특정 외부 글을 직접 참고하기보다는, ChatGPT와 대화하면서 아이디어를 확장했습니다. 도움을 받은 부분은 다음과 같습니다. Suno용 노래 콘셉트 정리 처절한 발라드에서 신나는 트로트 록으로 전환되는 구조 설계 가사 작성 및 후렴구 구성 4분 55초 노래를 10초 영상 단위로 나누는 장면 구성 Grok 이미지 생성을 위한 캐릭터별 프롬프트 작성 캐릭터를 귀엽고 큰 눈의 스타일로 통일하는 방향 설정 외부 사례를 추가한다면, 비슷한 참고 방향은 다음과 같습니다. AI music video workflow examples using Suno + image generation + short video generation Korean comedy music video references Character consistency prompt examples for AI video generation Cute cartoon-realistic character prompt examples https://www.youtube.com/watch?v=i3IHFsKQtso
    0
    2
  • 처음 시도해 본 AI 숏폼 제작 과정과 배운 점

    소개 수업 시간에 배웠던 직장인들을 타겟으로 한 '연봉 협상 시 절대 하면 안되는 말'에 대한 숏폼 영상 제작을 시도하였습니다. 평소에 기획 내용 구상부터 영상 제작, 완성까지 손이 많이 드는 숏폼 제작 과정을 AI를 통해 효율화해보고싶었고 생각보다 금방 완성이 되었습니다. 특히 가상 캐릭터를 설정하고 대본, 이미지, 영상, 음성까지 어색하지 않게 일관된 분위기의 영상을 만드는 것이 목표였습니다. 진행 방법 어떤 도구를 사용했고, 어떻게 활용하셨나요? 이미지 생성 : 제미나이 영상 : 구글 플로우 Tip: 사용한 프롬프트 전문을 꼭 포함하고, 내용을 짧게 소개해 주세요. // Scene 1. 후킹 부분 { "image_prompt": "mentor-kim, 미디엄 샷, 현대적인 사무실 배경, 차분하고 전문적인 표정, 자연광, 9:16 비율", "video_prompt": "천천히 줌인되는 6초 영상, 미세한 고개 끄덕임 포함, 입모양은 말하는 호흡에 맞춤.", "dialogue": "연봉 협상에서 이 말 한마디로 내 연봉이 깎일 수 있다는 사실, 알고 계셨나요?" } // Scene 2. 본문 (열심히 하겠다의 함정) { "image_prompt": "mentor-kim, 미디엄 샷, 한 손을 들어 강조하는 포즈, 뒤쪽은 약간 아웃포커싱된 깔끔한 오피스, 9:16 비율", "video_prompt": "말하는 제스처와 함께 손가락 끝에 살짝 모션 추가.", "dialogue": "첫째, '앞으로 진짜 열심히 하겠습니다.' 열심히는 기준이 없습니다. 객관적인 수치와 데이터로만 말해야 합니다." } // Scene 3. 본문 (다른 회사 알아보는 중의 함정) { "image_prompt": "mentor-kim, 미디엄 샷, 양손을 가볍게 벌린 제스처, 차분한 눈빛, 고급 회의실 배경, 9:16 비율", "video_prompt": "말을 꺼내며 양손을 천천히 내리는 미세 모션." } 전반적으로 믿음직스러운 베테랑 회사원 느낌을 내기 위해 여러 가지 상황을 설정하였습니다. Tip: 활용 이미지나 캡처 화면을 꼭 남겨주세요. 근데 왜 영어로 말하는 지는 잘 모르겠어요 ㅜㅜ 결과와 배운 점 배운 점과 나만의 꿀팁을 알려주세요. 프롬프트를 작성할 때 단순히 '정장 입은 남자'라고 치기보다 '30대 후반 베테랑 인사담당자 출신 코치' 이런 식으로 구체적인 역할을 부여하면 더 만족스러운 결과물이 나온다는 점을 배웠습니다. 과정 중에 어떤 시행착오를 겪었나요? 이미지를 비디오로 변환할 때 인물의 입모양이나 제스처가 부자연스러운 현상이 생기는데 이를 해결하기 위해 '미세한 고개 끄덕임', '말하는 호흡에 맞춤' '양손을 천천히 내리는 미세 모션' 등 움직임을 디테일하게 지시하는 과정이 필요했습니다. 도움이 필요한 부분이 있나요? 왜 영어로 말할까요 ..? 앞으로의 계획이 있다면 들려주세요. 이번 에피소드를 시작으로 일단 직장인 커리어 꿀팁도 완성해보고 직장 생활에 활용할 수 있는 다른 숏폼도 만들어볼까 합니다 !
    0
    4

뉴스레터 무료 구독

👉 이 게시글도 읽어보세요!

  • 박수비타민 — 체조 AI 영상 Kling 모션 클론 활용기

    ## 소개 지난 주 스터디에서 힌트를 얻은 Kling 모션 클론을 사용해봐야 해서 동작이 가장 간단한 영상을 제작해봤습니다. 건강박수는 누가 언제부터 했는지 모르겠지만, 노인 체조 중 레전드 스테디 체조입니다. 그런데 효능과 박수를 설명하면서 박수만 치는 영상들이 다 지루합니다. 그래서 박수와 효능을 가사로 하는 신나는 노래로 건강박수 영상 ‘박수 비타민’을 제작했습니다. ## 완성 영상 https://youtu.be/mO7R6O8C8Sw?si=eXF1Pjr5oRrHyani ## 사용 툴 - 기획·문서화: Claude Code - 노래: 수노 - 이미지 생성: 나노바나나2 - 영상 클립 분리: LosslessCut (https://github.com/mifi/lossless-cut/releases) - 모션 클론: 힉스필드 Kling (모션 클론) - 편집: CapCut ## 진행 방법 1) 캐릭터와 씬 이미지 기존의 나훈훈 캐릭터를 그대로 사용하는데, 캐릭터를 레퍼런스로 넣고 배경 이미지를 생성하려고 하니, 인물 일관성도 걱정되지만, 제일 우려된 건 인물 크기와 구도였습니다. 팝아트 스타일의 풍경을 하려고 했더니, 인물까지 팝아트 스타일로 바뀌기도 했구요. 그래서 배경 이미지만 생성하고, 캡컷에서 합성해서 스틸 컷으로 씬 이미지를 준비했습니다. 박수 준비 동작이 다 동일하니, 좀 수월했습니다. 2) 동작 촬영 원본 동작 영상을 제가 직접 촬영했습니다. 힉스필드에서 Kling 모션 클론 기능으로 촬영 영상의 동작을 나훈훈 캐릭터에 적용하려구요. 대충 찍었지만 그래도 영상에서 인물 사이즈와 구도는 유지했습니다. 찍는 것은 귀찮지만, ai 영상 생성에 자주 시행착오하거나 크래딧을 날리는 것보다는 낫습니다. 3) 영상 클립 분리 — LosslessCut** 촬영 영상을 모션 클론에 넣기 위해서 쪼개야 하는데, 클로드코드가 LosslessCut을 알려줬습니다. CapCut으로 하면, 각 클립마다 렌더링해야하는 것 같아서.. LosslessCut은 UI 화면이 좀 작긴 하지만, 구간을 모두 마킹한 뒤 한 번에 내보낼 수 있고, 무료라서 꽤 쓸만합니다. LosslessCut 다운로드: https://github.com/mifi/lossless-cut/releases 4) 힉스필드에서 Kling 모션 클론 "Add motion to copy"로 촬영 영상(3~30초)을 올리고, "Add your character"로 캐릭터 이미지를 올립니다. 모델은 Kling 3.0 Motion Control, 품질은 720p, 6~9초 정도 1회 생성에 6~9크레딧이 소요됩니다. - Scene control mode 이걸 켜면 배경 소스를 캐릭터 이미지 또는 모션 영상에서 선택할 수 있습니다. Image 탭을 선택하면 캐릭터 이미지의 배경이 그대로 영상 배경으로 사용된다는 겁니다. 저는 배경이 합성된 캐릭터이미지를 유지해야 하니까요. 그런데, 레퍼런스 캐릭터처럼 상반신 구도를 유지하지 않고, 자꾸 우스꽝스럽게 하체를 새로 생성하네요. - Orientation Scene control mode를 끄고 Orientation 기능을 테스트해봤습니다. Orientation에서도 video와 image를 선택할 수 있는데, 결과적으로 이 기능이 image의 캐릭터와 배경을 유지해줬습니다. Orientation Image 버튼이 비활성화 되는 문제가 있어서 여러가지 테스트 해보니 모션 영상 소스 클립이 길 때 그런 것 같습니다. 그러더라도 프롬프트에 구도와 배경을 한 번 더 작성했던 것 같습니다. - 생성 영상 길이 박수가 동일한 동작이 반복적이고, 크래딧이 아까워서 짧은 영상을 생성해서 반복 사용하면 된다고 생각했는데, 다소 미련했습니다. 영상 클립 재활용은 타이밍 편집이 역시 어려웠습니다. 다시 하면 동작을 조금 더 길게 생성할 것 같아요. - 일관성 그래도 유지되는 편인데, 이미지보다 어딘지 모르게, 영상 인물인 저와 닮아지는 느낌이 있습니다. 인물 분위기나 동작이 조금 더 여성스러워지기도 하고요. 다음 촬영때는 참고해야겠습니다. 5) CapCut 편집 모션 클론 클립을 짧게 생성했더니 박수 동작이 반복될 때 클립을 여러 번 붙여야 했습니다. 끊김 없이 자연스럽게 이어지는 것은 역시 잘 안됩니다. 아무래도 동작이라서 리버스도 어색합니다. 영상을 좀 더 길게 생성했어야 했는데, 크래딧 아끼다가 노가다가 늘었네요. - CapCut 편집 효과 이번에 토옵짱님이 공유해주신 CapCut 효과 영상을 참고해서 편집 효과를 활용해봤습니다. 이번 영상이 배경이 정적인데, 훨씬 생기 있어 졌습니다. 캡컷을 유료로 쓰는 동안에 효과를 많이 써봐야겠습니다. ## 자동화 적용 가능성 작업 후에 자동화 가능한 부분을 확인해보니, 힉스필드 Claude Code CLI 연동이 있네요. 이미지, 영상생성은 되는데 모션 클론은 안됩니다. 이번 작업처럼 씬과 동작이 비슷한 패턴일 때는 사용해보려고 합니다.
    10/06/2026
  • [Antigravity × Remotion] 인기 유튜브 숏폼 스타일 그대로! AI와 함께 텍스트만 바꿔 다음 영상 찍어내는 '마법의 템플릿' 제작기

    # [Antigravity × Remotion] 인기 유튜브 숏폼 스타일 그대로! AI와 함께 텍스트만 바꿔 다음 영상 찍어내는 '마법의 템플릿' 제작기 ## 📝 한줄 요약 마음에 드는 인기 유튜브 쇼츠 영상의 편집 스타일을 AI와 함께 단 20초 만에 완벽히 분석한 뒤, 이를 누구나 대사와 이미지만 바꾸면 5분 만에 완성도 높은 비디오로 찍어낼 수 있는 '재사용 카드형 프레임 템플릿'으로 Remotion에 구축했습니다. 매번 편집 툴에서 자막과 블러 효과를 잡던 번거로움을 완전히 해결하여 제작 시간을 1편당 3시간에서 단 5분으로 단축하고, 브랜드의 일관된 시각적 정체성을 완벽하게 확립했습니다. **바쁘시면 이것만 읽어도 돼요:** - **사용한 도구와 목표**: AI 코딩 비서 Antigravity와 리액트 기반 영상 합성 엔진 Remotion을 결합하여, 유튜브 쇼츠의 최신 트렌드 레이아웃을 고스란히 이식한 재사용 가능한 '카드형 비디오 프레임' 구축. - **과정 중 깨달은 점**: 영상의 시각적 완성도뿐만 아니라 비즈니스 스케일업을 위해서는 매번 일회성으로 영상을 편집하는 것이 아니라, 설정 데이터(JSON)와 템플릿을 완전히 분리해 '한 번 구축하면 평생 재활용하는 시스템'을 만드는 것이 핵심이라는 점을 깨달았습니다. - **핵심 해결 방법**: 유튜브 레퍼런스의 모서리가 둥근 중앙 카드, 배경 블러, 자막 테두리 두께 등의 상세 비율 스펙을 AI에게 의뢰해 추출하고, Remotion의 합성 코드를 고도화해 다크 테두리 블러 비율을 90%에서 94%까지 디테일하게 피드백 조정하며 최상의 가독성을 찾아냈습니다. - **특별히 인상적이었던 순간**: 다중 프로젝트 간에 자막이 엉키는 기술적 충돌을 리모션 조건부 가드 코드로 깔끔하게 제어하는 한편, AI 이미지 생성 시 구글 Imagen/Flow의 민감한 정책 위반 필터를 한글 텍스트 제거 및 간결한 영어 영문 우회 묘사로 2차에 걸쳐 안전하게 풀어내며 위기를 극복한 순간이었습니다. - **확장성/재사용성**: 완성된 '마법의 프레임'은 다른 커피 전문점이나 F&B 매장, 혹은 아예 다른 업종의 홍보 숏폼을 제작할 때도 별도의 편집 기술 없이 설정 파일의 이미지와 대사 텍스트만 덮어써 주면 5분 만에 브랜딩 비디오로 재탄생시킬 수 있습니다. - **배운 교훈**: AI를 이미지 생성이나 프로그래밍에 활용할 때 막히거나 오류가 발생하면 포기하지 말고, 문맥을 세분화하여 단계적으로 수정 요청을 하거나 우회 템플릿을 설계하는 구조적 협업이 가장 효과적이라는 점을 배웠습니다. --- ## 🎯 이런 분들께 도움돼요 - **인기 유튜브나 인스타 릴스 편집 스타일을** 내 영상에 그대로 가져와서 빠르고 트렌디하게 연출해보고 싶은 마케터 및 1인 크리에이터 - **매번 영상 만들 때마다** 편집기 자막 폰트 크기 조절, 배경 음악 삽입, 싱크 맞추기 등의 수작업 노가다에서 해방되고 싶으신 분들 - **통일감 있는 숏폼 시리즈를** 규칙적으로 양산하여 브랜드 채널의 시각적 신뢰도와 아이덴티티를 100% 견고하게 구축하고 싶으신 1인 창업가 --- ## 😫 문제 상황 (Before) 가상 카페 브랜드 '카페메이트'의 숏폼 브랜드 필름 1화를 멋지게 제작한 뒤, 2화, 3화 에피소드를 양산해 나가는 로드맵을 그리고 있었습니다. 하지만 영상의 종류나 배경이 달라질 때마다 매번 영상 편집 도구를 켜서 자막의 외곽선 두께를 다시 조정하고, 배경을 블러 처리하며, 중앙 정렬 카드의 크기를 수동으로 맞추는 작업은 막대한 시간 낭비였습니다. 자칫 디테일을 조금이라도 놓치면 채널에 올라가는 영상들의 톤앤매너가 미세하게 비틀어져 시각적 정체성을 해치기 십상이었습니다. 비개발자로서 매번 디자인 시스템을 다시 세팅하는 번거로움을 원천 차단하고, **"레퍼런스로 삼은 잘 만든 유튜브 쇼츠의 세련된 디자인 레이아웃(프레임)을 그대로 고정해 두고, 텍스트와 에셋만 바꿔 끼우면 10분 안에 완성되는 마법의 복제 프레임"**을 반드시 완성해야만 숏폼 대량 제작 파이프라인을 굴릴 수 있었습니다. --- ## 🛠️ 사용한 도구 - **AI 코딩 및 협업**: Google Antigravity (Advanced Agentic Coding Agent) - **비디오 합성 및 렌더링**: Remotion (React/TypeScript 기반 자동 영상 그래픽 렌더러) - **이미지 생성 AI**: Google Gemini (실사 웰메이드 그래픽 엔진) - **비디오 생성 AI**: Google Veo 3.1 (`veo_native_speech` 한국어 성우 모드 탑재) - **프로젝트 모니터링**: Vanilla JS zero-dependency dashboard (Python http.server 구동) --- ## 🔧 작업 과정 ### [1단계: 인기 유튜브 쇼츠의 편집 비밀을 파헤치다] - 레퍼런스의 스타일 요소 정밀 분석 제일 먼저 해야 할 일은 시청자의 눈길을 사로잡은 잘 만든 유튜브 쇼츠(세모내모 채널 등)의 편집 기법을 온전히 훔쳐 오는 것이었습니다. 저는 레퍼런스 비디오를 AI에게 넘겨주며 내용이 아닌 '비주얼 스펙'만 정밀하게 뜯어봐 달라고 요청했습니다. ``` 아래 참고 영상의 내용은 따라하지 말고 편집 스타일만 분석해줘. 참고 영상: https://youtube.com/shorts/dCR-fGe9_iQ?si=KOuID21fr5U_uBNy 분석 구간: 0:00~0:20 ``` AI는 영상을 읽고 비개발자인 저로서는 놓치기 쉬운 디자인 요소들을 다음과 같이 완벽한 기획 스펙서로 일목요연하게 구조화해 주었습니다. - **배경 연출**: 원본 화면을 바깥 영역에 넓게 배치한 뒤 강한 가우시안 블러(Gaussian Blur) 처리를 하여 아늑하고 트렌디한 깊이감 부여 - **중앙 카드**: 모서리가 둥글게 깎인 반투명 중앙 포커스 카드를 배치하여 스마트폰 시청자들이 정보에 완전히 집중할 수 있게 설계 - **자막 폰트**: 배경과 확연히 대조되도록 두껍고 짙은 텍스트 스트로크(외곽선)를 적용해 가독성 극대화 - **레이아웃 장식**: 화면 상단에 일관된 로고 배너와 카테고리 태그를 삽입해 전문 브랜드 필름으로서의 신뢰감 확보 --- ### [2단계: Remotion 리액트 코드로 마법의 프레임 이식하기] - 템플릿화와 카드 비율 미세조정 분석 완료된 스펙을 토대로 저는 AI에게 저희 '카페메이트' 숏폼 시리즈에 이 트렌디한 편집 스타일을 온전히 녹여낸 버전 2 리액트 합성 컴포넌트를 빌드해 달라고 요청했습니다. ``` 카페메이트 마스코트 숏폼 시리즈 영상을 새로운 편집 스타일을 적용해서 버전2로 만들어줘. ``` AI는 즉시 소스코드 파일을 뜯어 컴포넌트를 고도화하기 시작했습니다. 원본 영상을 복사해 배경으로 깔고 가우시안 블러 스타일을 준 뒤, 그 위에 모서리가 둥글고 원목 느낌이 나는 줌-인 효과의 중앙 프레임 카드를 얹었습니다. 그리고 텍스트 스트로크가 적용된 자막을 spring 애니메이션 모션과 함께 중앙 하단에 배치했습니다. 하지만 첫 테스트 빌드를 돌렸을 때 카드 테두리의 블러 영역이 지나치게 두꺼워 중앙의 예쁜 카페 이미지들이 작게 갇혀 있는 느낌이 들었습니다. 저는 즉각 구체적인 수치 피드백을 주었습니다. ``` 블러처리된 테두리를 좀 더 얇게 해줘 ``` AI는 이 피드백을 받아들여 중앙 카드의 가로 폭 비율을 기존 90%에서 **94%**로 넓히고, 세로 높이 역시 54%에서 **64%**로 확장하여 테두리 블러 비율을 슬림하게 깎아냈습니다. 상단 top 마진도 14%로 완벽하게 미세 조정하여 시각적 답답함을 완전히 털어냈습니다. --- ### [3단계: 평생 우려먹는 템플릿 완성] - 단 5분 만에 버전별 렌더링 무한 복제 및 이력 보관 이렇게 완성한 프레임(폼)이 일회성에 그치지 않도록, AI는 설정 파일(JSON)의 텍스트 대사들과 이미지 리소스 경로들만 변경하면 리모션 합성 빌더가 즉각 동일한 비율과 블러 모션을 지닌 새 영상으로 출력하도록 시스템 파이프라인을 완전히 구축해 주었습니다. 특히 버전 간의 비주얼을 번갈아 가며 꼼꼼히 검증하고 싶었던 저를 위해, AI는 렌더링 시 기존 파일을 무작정 덮어쓰지 않도록 렌더링 코드를 유연하게 조율해 주었습니다. ``` 기존 영상과 수정된 영상 2가지 다 볼 수 있었으면 좋겠어 원래 영상은 안 보이는데 어디 있어? ``` AI는 빌드 설정 시스템을 확장하여, 동일한 소스 데이터를 기반으로 하되 스타일 옵션만 다르게 적용해 아래 3가지 버전을 각각 다른 파일로 안전하게 생성해 수납해 주었습니다. 1. `final_v1_flat.mp4` (전체 화면 꽉 찬 클래식 버전) 2. `final_v2_90.mp4` (90% 카드 레이아웃의 슬림 버전) 3. `final_v2_94.mp4` (94% 확장형 최종 트렌디 버전) 이제 저는 대시보드나 설정 JSON 파일만 열어 텍스트와 그림만 쓱 바꾸고 빌드 명령을 누르면, **단 5분 만에 2화, 3화가 똑같은 황금비율 프레임**을 입고 튀어나오는 마법 같은 대량 양산 폼을 온전히 소유하게 되었습니다. --- ### [4단계: 예상치 못한 위기 해결] - 구글 이미지/비디오 모델 정책 위반 필터 우회 작전 신나게 2차 에피소드를 생성하려는데 갑자기 예상치 못한 장벽에 부딪혔습니다. 첫 번째 씬의 캐릭터 동작을 '합장'에서 '양손을 반쯤 흔드는 제스처'로 바꾸기 위해 이미지와 비디오 프롬프트를 갱신하는 순간, 구글의 Imagen/Flow AI 엔진이 **"정책 위반(Policy Violation)"** 경고를 뱉으며 생성을 거부한 것입니다. ``` 이 프롬프트 이용하니깐 구글 정책위반이라고 하는데 어떻게 바꿔야해? ``` 당황한 저에게 AI 어시스턴트는 구글의 안전 필터 작동 원리를 명쾌하게 분석해 주었습니다. 한국인을 특정하는 단어("Korean")나 내부 고유 기호("cafe-mate"), 그리고 한글 대사가 프롬프트 텍스트에 포함되었을 때 문자 검열 필터가 민감하게 반응하여 사람 생성을 차단한 것이 원인이었습니다. AI는 두 단계에 걸쳐 프롬프트 구조 개편을 감행했습니다. - **1차 조치**: 인종/브랜드 고유 명사 대신 중립적인 옷차림과 물리적 제스처 묘사 위주로 수정 - **2차 조치 (초간결 영문 우회)**: 여전히 발생하는 검열에 대응하여 프롬프트 내 모든 한글 텍스트 대사를 완전히 배제하고, 오직 순수 100% 영문으로만 동작과 피사체를 극도로 간결하게 묘사하는 안전 프롬프트 작성 ``` 그래도 위반이라는데? ``` 이 끈질긴 2차 우회 시도를 통해 AI는 마침내 구글 정책 필터를 완벽히 통과하는 안전 코드를 찾아냈고, 마스코트가 양손을 반쯤 들어 반갑게 손을 흔들며 다정하게 손님을 맞이하는 아름다운 고품질 비디오 소스를 아무런 차단 없이 깔끔하게 추출해 내는 데 성공했습니다. --- ## ✅ 결과 (After) 이번에 구축한 Remotion 기반 '마법의 카드형 프레임 템플릿' 덕분에 숏폼 기획과 편집의 전체 게임 체인저가 되었습니다. ### Before vs After | 항목 | 기존 방식 (Before) | AI 파이프라인 (After) | |------|--------|-------| | **1편당 제작 및 편집 시간** | 약 3시간 (자막 외곽선 수동 편집, 블러 효과 재현, 비디오 크기 조정) | **단 5분** (설정 JSON 파일의 텍스트와 이미지만 갈아끼운 후 자동 빌드) | | **비주얼 브랜드 일관성** | 제작할 때마다 레이아웃과 블러 비율이 미세하게 틀어짐 | **94% 카드 프레임의 규격화**로 어떤 콘텐츠든 100% 균일한 톤앤매너 유지 | | **신규 프로젝트 양산 속도** | 새 영상 기획 시 디자인 레이아웃부터 다시 고민하고 빌드 | 이미 완성된 템플릿 폼을 그대로 가져와 **텍스트만 바꿔 즉시 양산 가능** | | **정책 규제 및 에러 해결** | 생성형 AI의 정책 필터 차단이나 기술적 오류 시 해결 방법을 몰라 중단 | AI의 **검열 원인 진단 및 우회 프롬프트 설계**로 즉각 돌파 | ### 결과물 - **버전 2 최종 완성 영상**: `projects/cafe_mate_shorts/outputs/ep01/final_v2_94.mp4` (48초, 39.6 MB, 94% 둥근 카드 프레임 및 spring 자막 모션 반영) - **버전별 비교 비디오 3종 세트**: 동일 폴더 내 flat, v2_90, v2_94 버전 보관 완료로 시각 피드백 대조 가능 --- ## 💬 이 과정에서 배운 AI 활용 팁 ### 효과적이었던 것 1. **레퍼런스 스타일 분석의 자동화**: 내가 흉내 내고 싶은 멋진 쇼츠 영상이 있다면 시간 들여 캡처하지 말고 AI에게 "이 구간의 편집 기법, 자막 스타일, 레이아웃 스펙만 뜯어서 기술적으로 요약해 줘"라고 요청하는 것이 트렌드를 흡수하는 가장 빠른 지름길입니다. 2. **템플릿과 데이터의 완전한 분리**: 비디오 코드에 값을 직접 박아 넣지(하드코딩) 마세요. `scenes.json`이나 `project.json` 같은 설정용 파일에 글씨와 이미지만 연동되게 디자인 뼈대(프레임)를 고정해 둠으로써 무한 양산 구조를 완성해야 합니다. ### 이렇게 하면 안 돼요 1. **AI 정책 필터에 정면 대결 금지**: "한국인", "브랜드명" 등에서 AI가 생성 차단 오류를 뿜을 때 억지로 단어를 반복해 넣지 마세요. 오히려 프롬프트를 100% 영문으로 바꾸고, 인물 세부 인종 명사를 일반적인 성별과 옷차림(예: black blazer) 위주의 중립적 묘사로 한 단계 낮춰 쓰는 것이 필터를 부드럽게 통과하는 요령입니다. --- ## 🌍 다른 업무에 적용한다면? - **쇼핑몰 신상품 소개 쇼츠**: 이 94% 블러 카드 템플릿 폼을 그대로 가져와서, 중앙 카드 부분에 신상 의류 이미지와 상품 설명 텍스트만 넣으면 매주 수십 개의 신상 소개 광고 영상을 10분 만에 릴스로 뽑아낼 수 있습니다. - **맛집/F&B 카드뉴스 비디오**: 매장의 신메뉴 시즐링 컷을 중앙 카드에 띄우고 하단에 텍스트 스트로크 자막을 입혀 인스타그램 릴스 및 네이버 모먼트용 홍보 클립으로 신속하게 스케일업할 수 있습니다. https://files-us-east-1.t-cdn.net/files/73XilHFJs15gHFRWcvgDS
    09/06/2026
  • 디즈니 예고편 st 애니메이션 만들기 (아직 갈 길이 먼..)

    디즈니 스타일 애니메이션 도전 픽사 디즈니 예고편 스타일의 애니메이션 영상을 만들고 싶어서 도전하게 되었다. 사내연애 커플의 스토리로 기획 방향을 잡고, 시나리오를 작성했다. 애니메이션 제작 과정 영상을 제작하는 데에 사용한 도구는 다음과 같다. 여러 도구를 사용하면서 결과물을 비교해보고, 최종적으로 각자 잘하는 것을 맡기게 되었다. - GPT : 실제 사진을 첨부하여 '디즈니 스타일 이미지' 생성 - 클로드 : 만들고 싶은 장면의 나레이션과 시나리오를 넣어 '영상 프롬프트' 생성 - Flow : GPT로 뽑은 이미지와 클로드로 뽑은 프롬프트를 넣고 애니메이션 영상 생성 GPT나 flow에 원하는 장면의 참고 사진을 넣고, 디즈니 스타일의 이미지를 만든다. 클로드에서 만들고 싶은 장면을 설명하여 '영상 프롬프트' 생성 (보통 뽑아준 그대로 사용하지는 않고, 조금씩 입맛에 맞게 변형하여 사용하고 있다) Flow에서 GPT로 만든 이미지와 클로드로 만든 프롬프트를 넣고 영상을 생성한다. 위 과정을 반복하면서 장면별 영상을 생성한다. 주인공 캐릭터들의 얼굴을 유지하는 게 쉽지는 않지만, Flow에서는 캐릭터를 저장하는 기능이 있어 해당 기능을 사용하면 비교적 비슷한 그림체를 유지할 수 있다! (물결님에게 배운 Tip) 시행착오와 팁 삽질을 거쳐 발견한 나만의 소소한 TIP 🪏 위 개발새발 그림처럼 사무실 구도를 잡고 싶었는데, 아무리 말로 설명해도 Flow 저 구도를 안뽑아줬다. 진짜 거의 10번 정도 시도한 것 같다 (내 크레딧 ㅠㅠ) 아무리 디테일하게 설명해도 계속 이렇게 떨어뜨려 놓고 책상 각도도 원하는 구도로 나오지 않았다. 그래서 마지막 방법으로 원하는 이미지를 먼저 만들고 (장면 이미지, 캐릭터 첨부하여 디즈니 스타일로 생성) Flow에 이 이미지를 첨부한 후, 아래처럼 디테일하게 프롬프트를 작성하니 원하는 구도의 영상이 만들어졌다. 그렇게 완성된 영상! (키보드 갑툭튀는 흐린 눈 하기로 결정 ..) 🪏 삽질 결론 : Flow에서 애니메이션 영상을 만든다면, 실제 장면이나 인물 사진을 넣는 대신 '애니메이션화 시킨 이미지'를 넣으면 이미지와 거의 유사하게 영상을 뽑는 것 같다. 결과와 배운 점 처음에는 한 장면을 만드는 데에 10번 이상 시도하기도 했다. 원하는 대로 잘 안나오기도 했고, 실제 장면과 똑같이 만들고 싶은 욕심이 크다보니 크레딧을 엄청 낭비했다. 그래도 그런 시도들 덕분에 차차 프롬프트 감이 잡혔고, 이제는 1-2번 만에 원하는 영상을 뽑는 것 같다. 아래는 Flow로 생성한 영상들! 틈틈이 영상을 만들고 있지만, 아직 갈 길이 멀다. 시나리오를 너무 길게 작성했는지 아직 만들어야 할 영상이 오조오억개 정도 남았다 .. 남은 장면들도 부지런히 뽑아서 연결하고 .. 나레이션 넣고 .. BGM 넣고 .. 언제 완성하지 ? 그래도 영상 만드는 동안에는 너무 너무 너무 재밌다 !!!!! 삽질하다가 원하는 영상이 뙇 나오면 희열과 도파민이 엄청나다 💥 조금 느리더라도 꾸준히 작업해서 꼭 영상을 완성해야지! (제발) 아 그리고 자정을 넘어 새벽이 되면, 지구 반대편 사람들이 일하는 시간이라 Flow에 과부하가 걸리는 걸까? 거의 파업한 것처럼 오류를 뱉어낸다 ㅠㅠ 실패 오류가 나거나 아예 뜬금없는 영상을 보여주기도 한다. 다른 팀원분도 새벽 시간에만 같은 증상이었다고 하는 걸 보니 나만의 오류는 아닌 것 같고 .. 이런 부분도 차차 개선되긴 하겠지만, 일단 지금의 Flow는 새벽보단 오후 시간대가 작업하기 좋은 듯!
    09/06/2026
  • 어떻게 하면 한 방에 원하는 영상이 나올까?

    한방에 끝내기 도전 [소개] 어떻게 하면 한 방에 원하는 영상이 나올까? 지난주 춤추는 병아리 영상을 만들면서 깨달은 것이 있다. 헛발질의 연속...... 영상 하나 만들자고 시작했는데, 어느새 버려진 영상들이 조용히 쌓여가고 있었다. 이걸 만들다가 저걸 고치고, 저걸 고치다가 또 처음부터 다시. 영상은 하나인데 필요없는거....수백개.... 그 잔해들을 바라보며 결심했다. "이번 주는 다르다." 그래서 야심차게, 나름 치밀하게, 거의 작전처럼 준비했다. 그냥 만드는 게 아니라 설계하는 것이다. 이번 주 목표는 딱 두 가지였다. 첫 번째, 버려지는 영상 없애기. 두 번째, 유튜브 채널 새로 파서 꾸준히 운영하기. 채널 방향도 정했다. 한국 동요 쇼츠 채널. 누구나 따라 부를 수 있는 그 짧고 쉬운 노래들. 좀 있으면 방학이니....시간이 좀 나겠지... [진행 방법] 이번 작업의 핵심은 AI를 혼자 쓰지 않는 것이었다. AI를 릴레이처럼 이어 붙이는 작전. 각자 잘하는 것만 시키는 분업 체계를 구축했다. 작업 순서는 이렇다. 1단계 — Suno로 노래 생성 먼저 Suno에서 한국 동요를 만들었다. 기존에 음원은 내 소유인 것이 있어서, 그 영어 동요 음원을 넣고 한국어로 바꾸었다. (가사는 한국어로 번안했을 때 가장 그럴싸 한것으로 제미나이, 챗지피티, 클로드 모두에게 시켜서 제일 마음에 와 닿는 것으로 선택했다). 노래가 원본보다 더 잘 나왔다...너모 좋잖아~~~~역시 suno! 2단계 — Gemini로 노래 초단위 분석 만들어진 노래를 Gemini한테 넘겼다. "이 노래에서 몇 초에 뭐가 나오는지 분석해줘." 간주가 어디서 시작되는지, 가사가 바뀌는 지점은 어딘지를 초단위로 뽑아냈다. 영상 편집의 설계도가 되는 작업이다. 그리고 혹시, 까먹을까봐 매번 새로운 마음으로 화면 비율도 계속 이야기 해줌. 3단계 — ChatGPT로 이미지 생성 분석된 타임라인을 바탕으로 각 구간에 필요한 이미지를 ChatGPT에서 생성했다. 이미지가 완벽해야 영상이 완벽하다! 이렇게해서 완성된 이미지들 순서대로 넘버링! 4단계 — ChatGPT로 Grok용 프롬프트 작성 + 시뮬레이션 여기가 핵심이다. Grok에 바로 넣기 전에, ChatGPT한테 프롬프트를 먼저 써달라고 했다. 그리고 "이 프롬프트로 영상 만들면 어떤 그림이 나올 것 같아?" 하고 머릿속 시뮬레이션을 돌렸다. 일종의 리허설이다. 이 단계 덕분에 Grok에서 헛방을 많이 줄일 수 있었다. 위의 이미지들 넣고, 이 이미지를 움직이도록 영어 프롬프팅작성해서 얻은 영상들...... 순간 방심하여 헛방질 한 영상들 여전히 존재................. 5단계 — Grok으로 영상 생성 준비가 끝났으니 Grok 투입. 프롬프트가 이미 검증된 상태라 생각보다 훨씬 원하는 결과가 나왔다. 그래도 지난 주에 비하면.....헛방질 개수 줄어들었음에 용기를 얻자.. 6단계 — ElevenLabs로 효과음 생성 영상을 보면서 효과음이 들어가면 좋겠다 싶은 지점들을 표시해뒀다. 그 타이밍에 맞게 ElevenLabs에서 효과음을 생성했다. (더빙이 이번주 과제였는데...노래다 보니 더빙할 부분이.....마땅치가 않아서, 효과음이라도 넣어보자는 마음에 추가) 7단계 — CapCut으로 최종 편집 모든 미디어를 CapCut에 불러와서 편집했다. 중요한 건 무료 기능만 썼다는 것. 돈 안 쓰고도 충분히 제작은 가능했으나, 돈 좀 내고 펑펑 쓰는게 마음 편할 것 같다! https://youtube.com/shorts/sK-o9g24sb8?si=8M4VIztOrIA800gk [결과 & 배운 점] 지난주 교훈을 가슴에 새기고, 이번엔 전략을 짜서 원샷원킬!하자는 목표였다....그러나....여전히 힘든 과정.... Grok 무료 버전은 하루 생성 한도가 있으니, 2일 안에 치고 빠지는 구조로 가자. 첫째 날 최대한 뽑고, 둘째 날로 기약하는 방식. 결정적으로 달라진 건 속도였다. 지난주에는 생각없이 영상 생성하다가 엉뚱한 게 많이 나왔었다. 이번 주는 지난주 경험을 바탕으로 설계를 하고 실행했더니, 영상의 수가 눈에 띄게 줄었다. 완벽하진 않았지만..... 토욥님꼐서 채팅방에서 팁을 무한으로 공유해주고 계셔서 덕분에 다음에 시도해볼 것도 산더미다. 이게 또 다른 행복한 고민이다. 이번 주 정리하면서 느낀 것들: 반복과 연습만이 살길이다. 처음부터 잘하는 사람은 없다. 영상 하나 만들 때마다 조금씩 빨라지고 있다. 지난주의 나보다 이번 주의 내가 분명히 낫다. 실수한 만큼 성장한다. 지난주에 버렸던 영상들이 사실 이번 주의 설계도가 됐다. 헛발질도 데이터다. [다음 주 계획] 더 철저히 준비해서, 버려지는 영상 제로 도전! 🔥
    07/06/2026
  • 쿼카의 상상 속 주말🐨 숏폼 제작기 2탄! (더 생동감 넘치는 영상 구현하기)

    지난번 1탄에서는 '행복한 다이어터 쿼카'의 다이어트 합리화와 코믹한 엔딩을 담은 숏폼을 제작했었는데, 음성 부분과 BGM이 아쉬웠습니다. 이번에는 그 목표를 달성하기 위해 지난번 아쉬웠던 점을 보완하여 캐릭터에 실제 생동감 넘치는 음성을 입혀 2번째 영상을 제작해 보았습니다. 진행 방법 이번 영상 제작에는 지난번 사용했던 툴을 고도화하고, 음성 삽입을 위한 새로운 AI 도구를 추가로 활용했습니다. 기존처럼 시나리오와 프롬프트 제작은 안티그래비티를 활용했고 프롬프트를 이용해 제미나이와 영상을 먼저 구현했습니다. 하지만 여전히 원하는 싱크와 음성이 나오지 않아 기존 음성을 지우고 Hedra을 통해 음성을 삽입했습니다. 이번 프로젝트의 핵심인 음성 구현을 위해 AI 음성 도구로 쿼카 특유의 깜찍하고 억울한 목소리를 톤앤매너에 맞춰 생성했습니다. 이 오디오 파일과 영상을 Hedra에 넣어 자연스럽게 말하며 움직이는 쿼카 영상을 완성했습니다. 결과와 배운 점 오디오의 중요성: 확실히 지난번 정적인 영상보다 AI voice를 통해 목소리가 들어가니 캐릭터의 생동감이 200% 살아나는 것을 느꼈습니다. 캐릭터의 성격에 맞는 목소리 톤을 고르는 것이 숏폼의 몰입도를 좌우한다는 것을 배웠습니다. 나만의 꿀팁: Hedra에서 오디오와 이미지를 합성할 때, 이미지 속 캐릭터의 정면 응시 비율이 높을수록 립싱크가 훨씬 자연스럽게 출력되는 것 같습니다. 다음번에는 다른 이야기의 숏폼을 만들어 캐릭터를 더 다양한 이미지로 구현해 보고 싶습니다. 가능하다면 2~3분 분량의 미니 웹 애니메이션 시리즈 레이아웃을 잡아 스토리텔링 요소를 추가해 장기 콘텐츠로 발전시켜 보고 싶습니다
    10/06/2026

🔥 이 게시판에서 가장 활발한 멤버