[8기 AI 이미지 스토리 크리에이터] 과연 글자는 SVD 될까? (설치 난관 + 긴 시간 + 좌절.. but bonus...)


안녕하세요. 부박사입니다. AI 이미지 스토리 강의에서 소병철 파트너님께서 SVD 시대가 온다고 해서 한번 Video를 도전해봤습니다. 기술적인 것 거의 모르는 문과생인데, 열심히 따라 해봤습니다. 그리고, 그 전과 같이 저는 ‘문자’로 도전을 해봤습니다.


  1. 일단 깐다(설치한다)

일단 comfyUI를 깔았습니다. 다행히 저는 게임용 노트북이라서 NVIDIA 3060 그래픽 카드가 있습니다. 깔고 나니 스테이블 디퓨전과 외모만 약간 다른 쌍둥이라는 것을 뒤늦게 알게 되었습니다. 스테이블 디퓨전은 한방에 끝내는 쿨한 동생, comfyUI는 과정까지 자세하게 설명해주는 스윗한 형… 그러나 쌍둥이. 일단 프레임 버전이 낮은 걸로 깔았습니다.


  1. 이미지 to 비디오 로드 설치

파트너님께서는 이미지만 넣으면 뚝딱 비디오 파일이 만들어졌는데, 아무 것도 모르는 백지 상태에서 설치하는 데만 반나절 걸렸습니다. 업데이트 하고 이것저것 깔고, 작동 안돼서 다시 깔고, 시간이 오래 걸렸고 모든 것을 설치하는 데 데이터가 10기가 정도 나왔습니다.


  1. 이미지를 넣는다. 그리고 돌린다.

다 설치했다는 기쁨에, 정작 어떤 이미지를 넣을 지 몰라서 급하게 노트북에 있는 사진을 넣느라, 제 사인을 넣었습니다. 그리고 곧바로 후회했습니다. ‘아! 배경이 움직이는 거잖아.’ 후회했지만 이미 노트북은 열일 하고 있습니다. 노트북이 큰 소리를 내며 평소 사용하지 않아 먼지가 쌓였던 그래픽 카드가 돌아갑니다.


  1. 하염없이 기다린다.

22분이 넘게 걸렸습니다. 소병철 파트너님이 지난주 토요일 발표 때 성능 좋은 컴퓨터로 발표하고, 점심 식사 때 합류했었는데, 그 이유를 이제야 알았습니다. 시비타이에서 일반적인 컴퓨터는 2분이면 된다고 했는데, 제가 일반적인 이미지를 넣지 않고 글자를 넣어서 그랬는지, 결과적으로는 22분이 넘게 걸렸습니다. 1,395초가 걸렸다고 나옵니다.


마치 수능 점수를 펼쳐본 수험생처럼 클릭을 한 순간, ‘엥? 이건 뭐지?’라는 생각이 들었습니다. 사인이다보니 3자인데, 그 중에서 한글자만 나왔고, 다른 게 없이 글자만 두께가 두꺼워졌습니다. 그렇지만, AI가 평소에 접했던 이미지가 아닌 상황에서 이것도 만족스러운 결과일 수도 있다는 생각을 했습니다.


  1. 다른 것을 넣어보기로. 이왕이면 ‘GPTers’로


‘GPTers’ 캘리그라피 간단 설명 :

아이패드 ‘동글동글 브러시’ 약 ‘75% 크기’로 형상화한 ‘GPTers’ 입니다. ‘T’는 많은 사람들이 좋아하는 ‘7’을 형상화하되, 못 알아보지 않도록 너무 ‘7’자스럽지 않게 했고, ‘S’는 수많은 사람들이 모인다는 의미에서 대문자와 같이 키웠고, ‘T’자와 닿도록 하였습니다. 이는 ‘GPT’와 사람이 통한다는 의미입니다. 전체적으로 상승 기운을 고려하여 치켜 올라가는 가운데, ‘S’자가 안정을 취해주는 구도로 형상화했습니다.


기존 SVD 보면 주인공은 안 움직이고 주변이 움직였고, 이를 확인하기 위해 ChatGPT가 생성한 환호하는 사람들을 아래에 넣어 어설프지만 그림판으로 합성해보았습니다. 굳이 제목을 붙인다면 ‘환호하라 GPTers’ 혹은 ‘찬양하라 GPTers’입니다. 그림판에 강제 결합시키는 과정에서 ‘GPTers’가 좌우로 약간 뚱뚱해졌습니다.


  1. 무엇이 어떻게 움직일까. 또 하염없이 기다려본다.



이번에는 21분이 걸렸습니다. 결과는…


사람들은 안 움직이고 글자가 스크롤처럼 움직이는 결과가 나왔습니다. 게다가 글자도 알아볼 수 없을 정도였습니다. 긍정적으로 바라보자면 GPT와 GPTers의 발전 속도가 너무 빨라서 글자를 못 알아보는 것 같았습니다. 이상으로 SVD 설치 및 글자 이미지의 비디오 생성 과정을 서술했습니다. 전편과 같이 완벽하게 만족스러운 결과가 도출된 것은 아니었지만, 그래도 이를 통해서 SDV를 해보고, 이미지가 아닌 글자에 도전을 해서 결과까지 도출하는 결과를 얻었습니다. 또한 이 과정에서 ‘GPTers’ 캘리도 한번 써봤습니다.


<결론>

  1. SVD는

  • 오래 걸린다. 이미지가 아닌 문자를 넣어서 그럴 수도 있겠지만, 그래픽 카드 왕왕 돌아가면서도 20분 넘게 걸렸다.

  • 돌리고, 커피 마시고 오면 된다.

  • 설치하는 과정이 만만치는 않다. 다행히 오류가 나지 않아서 그나마 다행이었다.

  • 글자 이미지는 만족스러운 결과가 나오지는 않는다.

  • 그렇지만, 글자를 두껍게 해주는 효과 등 뭔가(?)는 해준다.

  • 결과로 나온 mp4 파일을 GIF 파일로 변환시켜서 업로드 하면 된다. <끝>


PS. ‘GPTers’는 개인적으로 마음에 든다.



<231214> 내용 업데이트


댓글에 소병철 파트너님께서 제안해주신 방법을 적용시켜봤습니다.

일단 사이즈를 줄였습니다. 사이즈를 줄일 때는 기존 이미지의 비율을 고려해야 합니다. 그렇지 않으면 이미지가 잘립니다. 저는 기존 이미지가 4:3 비율이어서 가로 685, 세로 512로 했습니다. 그리고 버킷 아이디를 20으로 줄였습니다. 그러니 정말 빠르게 생성이 됩니다.

일단 글자에만 집중해보기로 했습니다. 여러개가 나왔습니다. 할때마다 다르게 나왔고, 변수를 약간 변형시켜보니 또 다른 글자가 나왔습니다. 아래는 나왔던 것들 넣어봤습니다.


  1. 무지개빛 지피터스


  1. 네온사인 지피터스


  1. 망가지는 지피터스

  2. 현란한 지피터스

  3. 커지는 지피터스

  4. 도망가는(먹튀하는) 지피터스


  1. 춤추는 지피터스 (사이즈를 512 × 512로 해서 가로가 잘렸습니다)

  2. 소심하게 춤추는 지피터스 (사이즈를 512 × 512로 해서 가로가 잘렸습니다)

보너스 페이지) 많은 분들의 로망 ‘칼퇴’를 만들어봤습니다.



또 결론>

  1. SVD는 어렵다.

  2. 처음 접해보고, 매뉴얼을 다 모르는 상황에서 변수 조절만 잘 한다면, 괜찮은 작품이 나올 것 같다.

  3. 스테이블 디퓨전의 텍스트 효과와 Video를 연결한다면 더욱 괜찮은 작품이 나올 것 같다.

  4. 시간 가는 줄 모른다.

  5. 소병철 파트너님의 조언 감사드립니다.


PS. 칼퇴는 사랑입니다. (이 글을 김태현 대표팀께서 싫어하….)

2
3개의 답글

(채용) 콘텐츠 마케터, AI 엔지니어, 백엔드 개발자

지피터스의 수 천개 AI 활용 사례 데이터를 AI로 재가공 할 인재를 찾습니다

👉 이 게시글도 읽어보세요