소개
스터디 톡방에 어떤 분이 "아버님의 사진을 바꾸고 싶다"는 글을 올리신 걸 보고, 그 마음이 너무 공감되어 도와드릴 수 있을까 고민했어요. 그때 떠오른 게 아까 공유한 Threads의 사례였습니다.
해당 게시물처럼 이미지 안에 지시사항을 직접 넣는 방식이라면 가능하지 않을까 싶어, 요즘 핫한 ChatGPT의 이미지 생성 기능을 활용해보았습니다. 결과적으로는 실패했지만, 시도한 과정에서 배운 점을 공유해보려 합니다.
진행 방법
Threads 게시물처럼 이미지 안에 화살표나 메모 등 시각적 지시사항을 직접 넣어 이미지 생성 요청
사용 도구: ChatGPT의 이미지 생성 기능 (DALL·E 기반)
기대한 결과: 지시사항을 반영한 그림 생성 (예: "이 인물의 옷을 파란색으로 바꿔줘" 같은)
실제 결과: 대부분 지시사항이 무시되거나 이상한 결과물이 나옴
시도 과정
1. 원본 이미지와 첫 요청
"이 사진의 나머지는 그대로 두고 코끼리만 없애줘"
2. 직접 이미지에 그림을 그려 넣어 요청
"코끼리 → 사자로 바꿔줘" 라는 글과 함께 직접 이미지에 표시
3. ChatGPT 생성 결과
의도대로 코끼리를 사자 조각상으로 바꾼 결과도 있었지만
전체적인 형태나 배경이 미묘하게 바뀌거나 원본이 유지되지 않는 등 한계도 확인됨
결과와 배운 점
ChatGPT는 현재 이미지 안의 세부 지시사항을 정확히 이해하거나 반영하기 어려움
이 기능은 일반적인 텍스트 프롬프트로 그림을 그리는 것과는 달리, Inpainting(부분 수정) 기술이 필요한 상황이었음
ChatGPT(DALL·E)는 현재 이 기능을 지원하지 않음
반면, Midjourney, Runway 등 다른 도구는 이와 유사한 기능을 어느 정도 지원하는 것으로 보임
해결 방법 정리 (이미지 속 설명 캡처)
결론
툴의 한계를 명확히 아는 것이 중요함
원하는 작업에 따라 적합한 도구를 고르는 눈이 필요함
이미지 세부 수정이 필요하다면 Photoshop의 Generative Fill, Runway의 Inpainting, 또는 DALL·E API 기반 커스텀툴을 써야 함
도움 받은 글
다양한 도구를 다뤄보며 "이 툴은 어디까지 가능한가?"를 경험해보는 건 정말 중요한 학습이라는 걸 이번에 느꼈어요!