소개
스터디 톡방에 어떤 분이 "아버님의 사진을 바꾸고 싶다"는 글을 올리신 걸 보고, 그 마음이 너무 공감되어 도와드릴 수 있을까 고민했어요. 그때 떠오른 게 아까 공유한 Threads의 사례였습니다.
해당 게시물처럼 이미 지 안에 지시사항을 직접 넣는 방식이라면 가능하지 않을까 싶어, 요즘 핫한 ChatGPT의 이미지 생성 기능을 활용해보았습니다. 결과적으로는 실패했지만, 시도한 과정에서 배운 점을 공유해보려 합니다.
진행 방법
Threads 게시물처럼 이미지 안에 화살표나 메모 등 시각적 지시사항을 직접 넣어 이미지 생성 요청
사용 도구: ChatGPT의 이미지 생성 기능 (DALL·E 기반)
기대한 결과: 지시사항을 반영한 그림 생성 (예: "이 인물의 옷을 파란색으로 바꿔줘" 같은)
실제 결과: 대부분 지시사항이 무시되거나 이상한 결과물이 나옴
시도 과정
1. 원본 이미지와 첫 요청
"이 사진의 나머지는 그대로 두고 코끼리만 없애줘"
2. 직접 이미지에 그림을 그려 넣어 요청
"코끼리 → 사자로 바꿔줘" 라는 글과 함께 직접 이미지에 표시
3. ChatGPT 생성 결과
의도대로 코끼리를 사자 조각상으로 바꾼 결과도 있었지만
전체적인 형태나 배경이 미묘하게 바뀌거나 원본이 유지되지 않는 등 한계도 확인됨
결과와 배운 점
ChatGPT는 현재 이미지 안의 세부 지시사항을 정확히 이해하거나 반영하기 어려움
이 기능은 일반적인 텍스트 프롬프트로 그림을 그리는 것과는 달리, Inpainting(부분 수정) 기술이 필요한 상황이었음
ChatGPT(DALL·E)는 현재 이 기능을 지원하지 않음
반면, Midjourney, Runway 등 다른 도구는 이와 유사한 기능을 어느 정도 지원하는 것으로 보임
해결 방법 정리 (이미지 속 설명 캡처)
결론
툴의 한계를 명확히 아는 것이 중요함
원하는 작업에 따라 적합한 도구를 고르는 눈이 필요함
이미지 세부 수정이 필요하다면 Photoshop의 Generative Fill, Runway의 Inpainting, 또는 DALL·E API 기반 커스텀툴을 써야 함
도움 받은 글
다양한 도구를 다뤄보며 "이 툴은 어디까지 가능한가?"를 경험해보는 건 정말 중요한 학습이라는 걸 이번에 느꼈어요!