※ 이 글은 GPTers 9기 AI 임팩트 보고서를 작성하기 위한 자료 조사를 목적으로 작성됐습니다.
Ⅰ. 생성형 AI 이미지가 가져온 ‘임팩트’
1. ‘생성형 AI’ 이미지 생성시대
1) ChatGPT
ChatGPT에 원하는 프롬프트 입력 뒤 이미지 생성 요청 시 이미지 생성
이미지와 함께 설명이 나오고, 필요시 생성ID 및 시드번호를 통해 미세수정 가능
아래 이미지는 프롬프트에
( ChatGPT 프롬프트 창에 ‘2024년 청룡의 해’를 넣고 생성한 이미지 )
2) DALL-E
GPTs에서 사용 가능하며, 기본적으로 이미지 2장이 나옴
( GPTs의 DALL-E 프롬프트 창에 ‘2024년 청룡의 해’를 넣고 생성한 이미지 )
3) 미드저니(www.midjourney.com)
미드저니는 '디스코드'라는 프로그램 안에서 구동되며 비용 발생(200번 생성 기준 한 달 10달러)
프롬프트를 넣으면 기본 4장의 이미지가 생성되며 한 장을 선택해 사용
커뮤니티 및 미드저니에 타인의 프롬프트를 볼 수 있어 프롬프트 복사 사용 가능
미드저니에 나만의 작업방(개인 서버)을 이용하는 것이 편리 (참고 : 미드저니에서 나만의 작업 방만들기)
( 미드저니 프롬프트 창에 ‘blue dragon’ 넣고 생성한 이미지 )
4) 스테이블 디퓨전(ConfyUI)
개인 컴퓨터에 스테이블 디퓨전 및 ConfyUI 설치 필요 (GPU 미장착시 구동에 어려움)
개인 컴퓨터가 아닌 웹 상(구글 코랩 및 런디퓨전)에서 구현 가능하고, 이 경우 GPU 여부는 상관 없음
런디퓨전(https://app.rundiffusion.com/)의 경우 1시간에 0.5달러로 사용 가능 ([8기 AI 이미지 스토리 크리에이터] RunDiffusion, 모두의 Diffusion 으로 영상 만들기)
( 스테이블디퓨전에 ‘blue dragon’ 넣고 생성한 이미지 )
5) 마이크로소프트 빙, 구글 제미니아 등 생성형 AI에서 이미지 생성 가능
2. 생성형 AI 이미지가 가져온 '임팩트'
1) 이미지 쉽고 빠르게 제작 가능
'2024 청룡의 해', 'blue dragon' 등 간단한 프롬프트만 넣어도 제작 가능
고화질의 이미지가 아닌 이상 1분 미만에 제작 가능
2) 비전문가 이미지 생성 및 AI 화가 탄생
프롬프트만 입력하면 이미지 생성 가능
AI화가 '칼로' 그림으로 전시회가 개최됨 2023년 한국AI작가협회(www.kaiart.or.kr) 설립, 작품 전시 및 교육
3) 유튜브& 쇼츠를 일반인들이 제작할 수 있음
전문가 아니어도 유튜브 및 쇼츠 제작 용이 (저자 제작 쇼츠의 예 : 2024년 개인사업자 승용차 업무전용보험 가입 안내드립니다)
4) 이미지를 통해 영상 제작 가능
ConfyUI를 통해 움직이는 영상(Image to Video) 구현 가능 ([8기 AI 이미지 스토리 크리에이터] 2024년은 AI Video 생성의 해)
OpenAI, 최근 AI 모델인 Sora 공개(https://openai.com/sora)
이는 작성된 프롬프트(text)를 최대 1분 길이 동영상(video)으로 변환
Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
(위로부터 OpenAI Sora 소개 화면, 프롬프트로 구현된 tokyo-walk.mp4 영상, 영상 구현 프롬프트)
3. 생성형 AI 이미지가 가져올 임팩트의 장점 및 한계점
1) 장점
프롬프트만 입력하면 쉽게 이미지 생성 가능
짧은 시간 안에 생성 가능
기본 프롬프트에서 원하는 그림에 맞도록 미세 조정 가능
현재는 저작권 문제에서 비교적 자유로움
보도에 활용 시 모자이크 대신 가상의 얼굴로 대체, 취재 제한되는 곳 ‘재현 이미지’ 사용해 보도
2) 한계점
학습된 이미지의 한계. 스테이블디퓨전의 경우 초기에 손가락 6개 등 기형 생성
디테일 구현이 용이하지 않음 않음.
진위에 대한 확인이 필요(예: 국제사진전 1등 당선 독일 작가 "사실은 AI가 만든 그림", 해외에서 난리난 ‘불타는 에펠탑’... AI사진 쓴 가짜뉴스였다)
(2023년 5월 22일(현지 시간) 트위터에 미국 국방부(펜타곤) 옆 건물이 불타고 있는 가짜 이미지가 급속도로 퍼져 많은 사람이 공포에 휩싸였다. 사진=X(구 트위터) 캡처)
대용량, 고화질 결과물의 경우 비용과 시간 투여가 필요
AI 로 학습된 이미지가 학습된 이미지여서 동양인, 인종 문제 등 편견 등에서 자유로울 수 없음
글자나 이미지에서 틀리는 경우가 있음
<출처>
[8기 AI 이미지 스토리 크리에이터] 2024년은 AI Video 생성의 해, 지피터스 AI 이미지-영상 만들기
[8기 AI 이미지 스토리 크리에이터] RunDiffusion, 모두의 Diffusion 으로 영상 만들기, 지피터스 AI 이미지-영상 만들기