이경호
이경호
🐶 AI 찐친
🎻 루키 파트너

[8기 프리스쿨] 이미지와 동영상 간단히 만들기


인공지능을 이용한 이미지와 간단한 영상을 만드는 방법은 많이 알려져 있습니다. 여기에서는 그런 경험이 없는 분들이 부담없이 접근해볼 수 있는 몇가지 방법을 소개해드릴께요~

소개해드릴 툴은 크게 세가지입니다. 그외에도 많지만, 무료로 일단 사용해보면 그 다음 고급툴로 넘어가기 수월한 것 같습니다. 저도 고급 사용자는 아니어서 각각의 툴에 대한 기초 사용법만 설명하고 넘어가도록 할께요~


1) DALL.E

제가 GPT-4를 사용하고 있어서 DALL.E도 같이 사용합니다. GPT-3.5에서도 이용이 가능한지는 잘 모르겠습니다 ^^; 하지만, 가장 기본적인 툴이라 과금여부를 떠나 소개해드려야 할 것 같습니다.

아주 간단합니다.

그냥 prompt에 원하는 이미지의 설명을 넣으면 됩니다. 다만, 해상도를 지정해주면 거기에 맞게 나옵니다.


그런데 하다보면 꼭 뭔가 부족하거나 원하는게 나오지 않았을 때 그것을 콕 찝어 나오게 하고 싶을 때가 있습니다. 그러면 prompt에 강조 표기를 하면 좋다고 알려져 있습니다. 다만, 된다는 보장이 100%는 아닙니다. 그렇게 될 확률을 조금 더 높인다는 것 뿐이죠.


보통 그림이 두개나오는데, 왼쪽것이 1번, 오른쪽 것이 2번 이미지입니다. 마음에 드는 이미지에 수정을 가하고자 할 때 유용한 방법은 gen_2의 id를 저장하고 불러 쓰는 것이 될 수 있습니다. 그렇다고 해서 100% 동일한 이미지로 사용하기는 조금 어렵습니다. 아래 그림을 보면 2번 이미지를 불러온 것인데, 분위기는 좀 비슷하지만, 다른 그림입니다.


2) Discord 가입 및 DeepL

많은 이미지 툴들이 Discord에서 동작하고 있기 때문에 Discord에 가입을 해두셔야 사용할 수 있습니다. GPT와 달리 한글은 안되고 영문으로만 가능합니다. 가장 유명한 미드저니(midjourney)도 소개해드리고는 싶지만, 유료로 변경되어 제외하였습니다. pica lab과 moon valley 두개를 소개해드릴께요.

deepL은 번역앱입니다. 성능이 좋다고 알려져 있고, 구글 translate보다 좋다고 합니다. 번역 앱 사용없이 본인이 직접 영문으로 입력해도 관계없습니다.


3) PIKA Lab

Pika Lab은 약 3초 정도의 짧은 동영상을 만들어주거나 내가 올린 사진에서 지정한 부분을 animation해주는 툴입니다. 바로 엊그제 version 1.0으로 업그레이드 되었는데, 더 많이 좋아진 것 같습니다.

인터넷에서 pika lab에 가입을 해두세요.

https://pika.art/


가입하고 사용하려고 하면 discord로 연결됩니다.


Discord는 별도의 어플리케이션으로 동작하고, 아래와 같이 화면이 나타납니다. 왼쪽편에는 내가 가입한 툴들중에서 discord에서 동작하는 것들이 로고 형태로 나타납니다. 오른편 위쪽에 보면 사각형의 회색 박스가 있는데요. 받은 편지함입니다. 보통 지시한 작업에 몇분이 걸리기 때문에 지시를 하고 기다리면 받은 편지함에 들어가 있습니다.

사용할 수 있다는 의미입니다. 클릭하고 pikalab에 들어갑니다.

pikalab에 들어오면 왼쪽 메뉴에 generate-1, -2….하는 메뉴가 있고, 아무데나 클릭하고 들어갑니다. 들어가서 아래 그림과 같이 prompt 에 ‘/’ 슬래쉬를 치면 명령러 리스트가 나타납니다.


/create 을 치면 이렇게 나타나고, prompt에는 DALL.E에서 사용한 prompt를 그대로 넣어도 됩니다. 그러나 ,옵션에 해당하는 것은 좀 다릅니다. 동영상이기 때문에 지시 옵션이 좀 다릅니다.

대표적인 옵션은

-ar : 화면비율입니다. DALLE에서 해상도를 명시했지만, 여기에서는 1:1, 9:16 하는 식으로 사용합니다. DALLE에서 512× 768로 만든 이미지는 PIKA LAB에서는 9:16 비율로 하면 됩니다.

-m : motion 레벨인데, 1~4까지 사용하고 숫자가 클 수록 동작이 많이 일어난다?고 이해하면 됩니다.

-gs : 1~24 까지 사용하는데, 숫자가 클 수록 첫 이미지를 보존하려는 특성이 강해진다고 합니다.

위와 같이 입력을 해봤습니다. 보통 +1 선택사항이라고 나타난 부분은 해도 되고 안해도 됩니다. 아래 처럼 되었네요~ 비행기를 넣었는데, 벌새처럼 날아다니는군요~ 사람과 차량도 번개처럼 다니는군요 ^^;;

A_vibrant_Seoul_in_2100_-ar_9_16_-m4_-gs_20__Image__1_Attachment_seed18004235541488404571.mp4


/animate 의 경우도 많이 사용합니다. 아무 옵션도 안넣고 해봤습니다. 옵션을 넣으면 달라질 것 같네요.

Image__1_Attachment_seed10276100542916283712.mp4


3) moonvalley

이제 moonvalley입니다. 스타트업 실험실의 부소장님인 유니니한테 힌트를 받아 저도 처음 해봤었습니다.

moonvalley에 들어가면 PIKA LAB과 비슷하게 왼쪽편에 메뉴가 좌르륵 나타납니다. new-moon-1, -2…중에 아무 곳이나 한군데 들어가서 prompt를 넣으면 됩니다. 마찬가지로 ‘/’를 넣으면 명령어가 나타납니다. 그런데, PIKA LAB과는 조금 다르죠.


PIKA LAB보다 조금 옵션이 많습니다. prompt에는 같은 내용을 넣으면 됩니다.

각 항목에 값을 넣어도 되고 안넣으면 그냥 default로 돌아가기 때문에 크게 고민하지 않으셔도 됩니다. 다만, moon valley가 PIKA LAB보다 조금 더 긴 5초 정도의 동영상을 제공합니다. 옵션중에서 duration을 길게 넣을 수록 qaulity가 좋아진다고 합니다. 동영상 시간이 길어지는 것은 아니고요. 대신 좀 더 오래 기다릴 수 있습니다.

GUdrYXE_output.mp4

이미지를 넣었음에도 불구하고 원본 이미지와는 많이 다릅니다.

그래서 moon valley에도 있는 animation을 해봤습니다.

cjTzjuj_output.mp4

animate은 원본 이미지를 좀 살려주지만, 건물까지 함께 변하네요 ^^~

아래 이미지는 한국여성으로 DALL.E에서 뽑은 이미지이고, 바람이 불어와 머리가 흩날리는 모습을 만들어 봤습니다.

my_wife_is_looking_at_me_with_lovely_smile_while_walking_along_the_street_hand_by_hand__Image__1_Att_seed6633192846811956648.mp4

중간에 눈이 희번덕 해서 깜놀했지만, 그럭저럭 좋았습니다~


4) 미드저니

미드저니도 사용법이 유사하기 때문에 간단히 말씀드립니다.

이미지나 영상품질이 매우 좋습니다. 저는 이정도 품질의 이미지나 영상을 아직까지는 필요로 하지 않아서 사용해보지는 않았습니다.


5) 스테이블 디퓨전 (Stable Diffusion)

디퓨전도 여러 용도에서 사용하는데, 괜찮습니다. 다만, 설치과정이 좀 까다로워서 나중에 별도로 시간내서 canRobot님과 소병철님 게시물을 참조하시면 활용하실 수 있을 것 같습니다.

아래는 제가 제작했던 몇가지 이미지입니다.


6) 3D 모델링(?)을 해주는 LUMA-AI => 따끈따끈

얼마전 무료로 공개된 사이트이고, 마찬가지로 discord에서 돌아갑니다.

사용법은 다 비슷합니다. “/genie”를 치면 prompt가 나오고 거기에 간단히 모델링하고 싶은 대상에 대해 영어로 작성하면 됩니다. 아래 그림은 산타크로스를 요청한 것인데, 항상 4개의 프로토타입이 나옵니다. 상당히 빨리 나와요. 이들중 마음에 드는 것을 골라 refine을 요청하면 시간이 좀 걸리긴 하지만 조금 개선된 형태로 나오는데, 생각보다는 완성도가 좀 떨어지긴 합니다 ^^;; 다른 사람들 것은 잘 나와요 ^^;

상단 좌로부터 1번 2번, 하단 좌로부터 3,번 4번 하는 식으로 번호가 부여되어 있습니다. 상단 1번을 refine 요청을 해봤어요.


다른 것들도 몇개 해봤습니다. 태권소녀, 에베레스트 산, 한복입은 산타할배를 해봤어요.

뭐랄까….에지있게 나와야 할 부분들이 좀 뭉개져서 나와요. 대신 모바일 게임의 아이템들은 꽤 쓸만하게 나올 것 같아요.

저장하는 과정이 조금 귀찮긴 합니다. 브라우저로 열어서 gif 파일로 저장하는데 세단계 정도 거쳐야 합니다. 자기들 웹페이지로 부르는 과정이 있기도 한데, 웹페이지로 가게 되면 완성된 작품의 색상이나 질감을 조절할 수 있고, AR로 보는 등 몇가지 기능들이 추가로 있습니다. 그런데, 그렇게 변현한 작품은 저장이 안되는지 저장을 했더니 JSON파일로 오더군요 ^^;; JSON 파일형태는 학습시킬 때나 써봤기에 잘 몰라서….무조건 통과 ㅎ

= = = = = = = = = = = =

아무튼….하루가 다르게 툴들이 쏟아져 나오네요.


이상입니다~



3
3개의 답글

📚 모집 중인 AI 스터디