생성형 AI 이미지가 가져온 ‘임팩트’

※ 이 글은 GPTers 9기 AI 임팩트 보고서를 작성하기 위한 자료 조사를 목적으로 작성됐습니다.


Ⅰ. 생성형 AI 이미지가 가져온 ‘임팩트’


1. ‘생성형 AI’ 이미지 생성시대


1) ChatGPT

  • ChatGPT에 원하는 프롬프트 입력 뒤 이미지 생성 요청 시 이미지 생성

  • 이미지와 함께 설명이 나오고, 필요시 생성ID 및 시드번호를 통해 미세수정 가능

  • 아래 이미지는 프롬프트에

( ChatGPT 프롬프트 창에 ‘2024년 청룡의 해’를 넣고 생성한 이미지 )


2) DALL-E

  • GPTs에서 사용 가능하며, 기본적으로 이미지 2장이 나옴

( GPTs의 DALL-E 프롬프트 창에 ‘2024년 청룡의 해’를 넣고 생성한 이미지 )

3) 미드저니(www.midjourney.com)

  • 미드저니는 '디스코드'라는 프로그램 안에서 구동되며 비용 발생(200번 생성 기준 한 달 10달러)

  • 프롬프트를 넣으면 기본 4장의 이미지가 생성되며 한 장을 선택해 사용

  • 커뮤니티 및 미드저니에 타인의 프롬프트를 볼 수 있어 프롬프트 복사 사용 가능

  • 미드저니에 나만의 작업방(개인 서버)을 이용하는 것이 편리 (참고 : 미드저니에서 나만의 작업 방만들기)


( 미드저니 프롬프트 창에 ‘blue dragon’ 넣고 생성한 이미지 )


4) 스테이블 디퓨전(ConfyUI)


( 스테이블디퓨전에 ‘blue dragon’ 넣고 생성한 이미지 )


5) 마이크로소프트 빙, 구글 제미니아 등 생성형 AI에서 이미지 생성 가능



2. 생성형 AI 이미지가 가져온 '임팩트'

1) 이미지 쉽고 빠르게 제작 가능

  • '2024 청룡의 해', 'blue dragon' 등 간단한 프롬프트만 넣어도 제작 가능

  • 고화질의 이미지가 아닌 이상 1분 미만에 제작 가능


2) 비전문가 이미지 생성 및 AI 화가 탄생

  • 프롬프트만 입력하면 이미지 생성 가능

  • AI화가 '칼로' 그림으로 전시회가 개최됨 2023년 한국AI작가협회(www.kaiart.or.kr) 설립, 작품 전시 및 교육


3) 유튜브& 쇼츠를 일반인들이 제작할 수 있음


4) 이미지를 통해 영상 제작 가능


  • OpenAI, 최근 AI 모델인 Sora 공개(https://openai.com/sora)

  • 이는 작성된 프롬프트(text)를 최대 1분 길이 동영상(video)으로 변환

tokyo-walk.mp4

Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

(위로부터 OpenAI Sora 소개 화면, 프롬프트로 구현된 tokyo-walk.mp4 영상, 영상 구현 프롬프트)


3.  생성형 AI 이미지가 가져올 임팩트의 장점 및 한계점

1) 장점

  • 프롬프트만 입력하면 쉽게 이미지 생성 가능

  • 짧은 시간 안에 생성 가능

  • 기본 프롬프트에서 원하는 그림에 맞도록 미세 조정 가능

  • 현재는 저작권 문제에서 비교적 자유로움

  • 보도에 활용 시 모자이크 대신 가상의 얼굴로 대체, 취재 제한되는 곳 ‘재현 이미지’ 사용해 보도


2) 한계점

       

(2023년 5월 22일(현지 시간) 트위터에 미국 국방부(펜타곤) 옆 건물이 불타고 있는 가짜 이미지가 급속도로 퍼져 많은 사람이 공포에 휩싸였다. 사진=X(구 트위터) 캡처)

  • 대용량, 고화질 결과물의 경우 비용과 시간 투여가 필요

  • AI 로 학습된 이미지가 학습된 이미지여서 동양인, 인종 문제 등 편견 등에서 자유로울 수 없음

  • 글자나 이미지에서 틀리는 경우가 있음



<출처>


3
4개의 답글

👉 이 게시글도 읽어보세요