🎨 캐릭터 일관성 실험기 — 펠트 고양이의 영상화 여정 🐾
이번 실험의 주제는 “일관성을 위한 캐릭터 재사용”
일관성을 가져가는 것으로 이미 생성된 이미지에 이어서 작업할 수 있으면 좋겠다고 생각하였습니다
그래서 카톡에 올라온 묘묘랑님의 4컷 이미지의 고양이 케릭터로 다양한 상황에 재등장시켜 영상으로 만들어보려는 시도를 해보았습니다
묘묘랑님의 이미지 원본
생각해보니 너무 급하게 하다보니 묘묘랑님께 허락도 안받았네요 (묘묘랑님이 만드신 고양이 좀 쓸게요~)
펠트 고양이, 계속 등장시키고 싶어!
약간 펠트 인형 느낌이 나는 고양이 캐릭터가 귀여워서 이 케릭터를 다양한 장면에 넣고 일관되게 활용해보면 어떨까 싶었어요.
처음엔 원본 이미지와 프롬프트를 조합해 스토리를 재현하려 했지만... 결과는 예상보다 험난했습니다.
프롬프트 스토리는 암울 → 성장 → 희망인데 초반의 암울한 늬앙스만 반영되어 암흑가의 고양이 사진이 탄생 ㅠ
프롬프트를 굉장히 세세하게 장면별로 작성하였는데 잘 반영이 되지 않았습니다
생성 단계를 거치면서 일관성이 꺠지고 원하는 분위기의 이미지가 재현되지 않아서 보류 ㅠ
🎞️ 프롬프트 실험과 모션 생성의 벽
그래서 다음 시도로는 배경을 제거한 고양이만 따로 추출해 동작 이미지를 만들고, 각 장면을 이어붙이려는 계획이었어요.
하지만! 동작 생성은 쉽지 않았고, 캐릭터도 점점 딴 사람이(?) 되어버리는 바람에 보류 😅
프롬프트를 자세히 써도 중간에 재질이나 표정, 분위기가 바뀌면서 일관성이 자꾸 깨지더라고요
동작 생성 (실패)
동작 생성 (실패)
동작 생성 (SOSO)
A cat lightly hops forward with a graceful and playful movement
The cat runs off to the right in light motion
A curious cat looks around, tilting its head from side to side with wide, inquisitive eyes, scanning its surroundings
오른쪽으로 천천히 달려가는 영상을 원하였지만 제자리에서 점프하며 마지막에 사악한 표정을 짓는 고양이가 되어 버림
주어진 한글 프롬프트에 대해 deepl이 전혀 다른 형태로 영작
영어 프롬프트를 좀 더 직접적으로 지정
하지만 부자연스러운 영상 생성
가방에서 꼬리가 나옴
원치않은 초반 프레임 동작
부자연스러운 달리는 모션
🐱 고양이가... 호랑이로?
귀엽고 부드러운 펠트 고양이를 원했는데, 어느 순간 호랑이로 변신!
코의 질감 이 펠트식으로 변하면서 ‘귀여움’ 포인트가 사라지는 일이 생겼어요.
케릭터 정체성은 유지되나 세밀한 부분의 왜곡
원본 귀여운 고양이 느낌
민둥민둥 느낌 (카툰 렌더링 느낌)
호랑이 같은 느낌
📸 4컷 이미지 활용 실험
그래서 방향을 조금 틀어봤습니다.
기존 4컷 이미지로 새로운 4컷 스토리를 만들어보고, 그걸 잘라서 영상으로 이어붙이는 방식!
이 부분도 처음 에는 스토리 프롬프트를 상세하게 주었는데 오히려 결과가 좋지 않아서 GPT에게 알아서 바꿔달라고 하니 오히려 더 자연스럽게 생성해 주었습니다
결과는? 어떤 건 꽤 귀엽고 좋았고, 어떤 건 순서가 뒤섞이거나 캐릭터가 변질(?) 되는 케이스도 발생
도중에 chatgpt 해외 유저가 급증한 시간인지 먹통이되고 시간 여유도 없어서 생성된 이미지들로만 클링을 통해 A → B 비디오 생성으로 마무리
실패
GOOD
…
고양이와 개구리
생성된 이미지의 케릭터들이 프레임을 침범하여 생성됨
Open ChatGPT Image 2025년 3월 31일 오전 11_02_30.png
고양이와 개구리 이미지로 영상 생성 - 고장난 야단법석 고양이가 생성됨
원래는 이렇게 한 컷씩 잘라서 영상으로 만들어서 이어 붙이려고함
고양이와 개구리 이미지를 주고 대사를 덧입히는 생성을 시도하였으나 케릭터 구분하는 능력이 부족하고 두 케릭터를 합쳐버리는 문제 발생
스토리 영상
고양이와 개구리의 황금 붕어빵 탐험기
프롬프트가 있던 항목이 삭제되어서 대략적으로 아래 처럼 이미지와 영상 프롬프트가 사용되었습니다.
고양이: 오늘 저녁은 개구리 스프
개구리: 나는 말을 할 줄 아는 지성이 있는 개구리라구!
고양이: (넘어지면서) 지성뿐만 아니라 힘도 세구나~
고양이: 그 말을 들으니 더 배가 고파졌어
개구리: 대신 황금 붕어빵이 있는 동굴 위치를 알려줄게
회고
시간적 여유가 있고 크레딧 여유가 있다면 4컷 이미지 2~5장으로도 1분 정도의 스토리 기반의 영상까지는 가능할 것 같다는 생각이 들었습니다
포토샵이나 프리미어 같은 기존 툴의 활용도 정말 중요하겠다는 걸 새삼 느꼈어요. 스토리를 영상으로 만드는 데 훨씬 유연성을 줄 수 있을 것 같아요.
다행히 최근 ChatGPT 이미지 생성이 업데이트되면서, 예전보다 캐릭터 일관성을 잡는 게 조금은 수월해진 느낌도 들었습니다!