ChatGPT Images 2.0 사용법 완벽 정리 — 한국어 텍스트·2K·Thinking 모드

ChatGPT Images 2.0가 공개되었습니다. 이번에는 단순 업그레이드가 아니라 "그리기 전에 먼저 생각하는(Thinking)" 이미지 모델이라, DALL-E 3 이후 가장 큰 점프로 평가받고 있어요.

특히 한국 사용자 입장에서 반가운 소식이 있습니다. 한국어 텍스트 렌더링이 대폭 강화됐거든요. 그동안 AI로 이미지에 한글만 넣으려 하면 글자가 깨지거나 이상한 자음이 섞여서 결국 포토샵으로 다시 얹어야 했는데, 이번엔 다릅니다.

ChatGPT Images 2.0은 OpenAI가 2026년 4월 21일 공개한 차세대 이미지 생성 모델 gpt-image-2를 탑재한 AI 이미지 생성 도구입니다. 텍스트 명령을 이해하고 바로 그리는 기존 방식과 달리, 생성 전에 모델이 스스로 추론하고 필요하면 웹 검색까지 활용해 결과물을 만들어냅니다.

ChatGPT 앱, Codex, API 전 영역에 제공되며, 무료 사용자도 기본 모델(Instant 모드)을 즉시 사용할 수 있습니다. 보다 정교한 결과물을 내는 Thinking 모드는 Plus/Pro/Business 구독자 전용이에요.

핵심 기능

1. 텍스트 렌더링 — 가장 큰 점프

항목

이전 (DALL-E 3 / gpt-image-1)

Images 2.0

영문 텍스트

짧은 단어는 OK, 긴 문장은 오타 빈발

문단 단위까지 정확

한국어/일본어/중국어

자음 분리·글자 깨짐 거의 확정

한글 메뉴판·포스터 수준으로 정확

작은 텍스트

UI 라벨, 가격표 거의 불가능

인포그래픽·다이어그램 라벨도 또렷

체감 포인트: 그동안 한글 이미지는 "AI로 초안 → 포토샵에서 글자 다시 얹기"가 공식이었어요. 이제 그 2단계가 사라집니다.

2. 추론(Reasoning) 추가 — 아예 새로운 축

이전: 프롬프트를 받자마자 바로 그리기 시작 → 복잡한 요구사항은 절반만 반영
Images 2.0: Thinking 모드에서 "이 장면엔 뭐가 필요한지" 먼저 계획하고 그림 → 구성이 복잡할수록 격차가 벌어짐

예: "5가지 메뉴 가격이 들어간 카페 포스터" 같은 요청에서 이전엔 가격이 뒤섞이거나 누락됐는데, 이제 정렬·크기 위계까지 알아서 잡습니다.

3. 웹 검색 연동 — 이전엔 없던 기능

이전: 학습 데이터 기준으로만 그림 (최신 인물·이벤트 반영 어려움)
Images 2.0: 생성 중 웹 검색 → 2025년 12월까지의 맥락 반영 가능

4. 해상도 & 비율

항목

Images 2.0

해상도

1024x1024 기본, 1792x1024까지

2K 지원

비율

정방형/가로/세로 3~4종

3:1 가로 ~ 1:3 세로 연속 지원

포스터·배너·릴스 커버 규격을 한 도구에서 전부 커버할 수 있게 된 거예요.

5. 이미지 일관성 (Multi-Image)

이전: 같은 캐릭터를 여러 장에 등장시키면 얼굴이 매번 달라짐
Images 2.0: 한 프롬프트로 최대 8장 생성, 캐릭터·스타일 일관성 유지

→ 만화, 스토리보드, 캐릭터 시퀀스 작업이 처음으로 실용권에 들어왔습니다.

6. 편집 품질 (In-Painting)

이전: 부분 편집하면 주변 픽셀이 뭉개지거나 스타일이 어긋남
Images 2.0: Image Arena의 Single-Edit·Multi-Edit 부문 동시 1위 — "배경만 바꿔줘", "글자만 교체" 같은 지시가 훨씬 자연스러움

7. "AI 냄새" 감소

이전: 과도하게 매끄러운 피부, 완벽한 조명 → 한눈에 "AI가 그림" 티남
Images 2.0: 질감·조명의 결이 자연스러워져 실제 사진·일러스트와의 경계가 흐려짐

이렇게 써보세요 — 실전 활용법

활용 1: 한글 인포그래픽·슬라이드 제작

발표 자료나 블로그 썸네일에 한글 텍스트를 직접 그려 넣어야 했던 상황, 이제 프롬프트 한 줄로 끝낼 수 있어요.

예시 프롬프트:

"카페 메뉴 포스터 디자인. 제목 '오늘의 커피', 한글 메뉴 5가지(아메리카노 4500원, 라떼 5000원, 카푸치노 5500원, 바닐라 라떼 5800원, 에스프레소 4000원), 베이지 배경에 미니멀한 일러스트. 2:3 세로 비율."

Thinking 모드를 켜면 가격 정렬, 글자 크기 위계까지 알아서 조정합니다.

활용 2: 마케팅 자산 일괄 생성

배너 하나를 Facebook(1200x628), Instagram(1080x1080), 블로그 헤더(1920x600) 등 여러 규격으로 한 번에 뽑을 수 있습니다. 광고 소재 제작 시간이 드라마틱하게 줄어들어요.

예시 프롬프트:

"22기 스터디 모집 배너. 메인 카피 '4월 27일 오픈', 서브 '실전 AI 마케팅 8주 과정'. 네이비 배경에 오렌지 액센트. 3가지 비율로 생성해줘: 16:9, 1:1, 9:16."

활용 3: 제품 이미지 편집 & 배경 교체

기존 제품 사진을 업로드하고 "배경만 북유럽 인테리어로 바꿔줘" 같은 부분 수정이 훨씬 자연스러워졌습니다. Image Arena의 Single-Image Edit / Multi-Image Edit 부문에서 모두 1위를 차지한 이유입니다.

활용 4: 만화·스토리보드 제작

한 프롬프트로 최대 8장의 연속된 장면을 만들 수 있어 캐릭터 일관성이 핵심인 콘텐츠에 딱입니다. 숏폼 스토리보드, 브랜드 만화, 제품 설명용 일러스트 시퀀스에 바로 쓸 수 있어요.

요금 & 시작하기

플랜

접근 범위

Free / Go

Instant 모드(기본 모델) — 즉시 사용 가능

Plus / Pro / Business

Instant + Thinking 모드 전체

API (gpt-image-2)

입력 이미지 $8/1M 토큰, 출력 이미지 $30/1M 토큰, 1024x1024 고품질 기준 약 $0.211

시작 방법은 간단합니다. ChatGPT 앱에서 "Images" 옵션을 선택하면 바로 새 모델이 적용됩니다. 별도 설정 없이 프롬프트만 입력하면 되고, Plus 이상 사용자는 모드 토글로 Thinking을 켤 수 있어요.

자주 묻는 질문

ChatGPT Images 2.0은 무료인가요?

네, 무료(Free) 및 Go 요금제 사용자도 기본 Instant 모드를 바로 사용할 수 있습니다. 다만 생성 횟수에는 일일 제한이 있고, 추론 기반의 고급 결과물을 뽑는 Thinking 모드는 Plus·Pro·Business 구독자 전용입니다.

ChatGPT Images 2.0은 한국어를 지원하나요?

한국어 프롬프트 입력은 물론, 이미지 내부에 한글 텍스트를 직접 그려 넣는 기능이 대폭 개선됐습니다. OpenAI는 일본어·중국어·힌디어·벵골어 등 비라틴 문자 렌더링을 공식적으로 강화했다고 밝혔어요.

gpt-image-2는 DALL-E 3, 기존 gpt-image-1과 뭐가 다른가요?

가장 큰 차이는 생성 전 추론(reasoning)과 웹 검색 연동입니다. 텍스트 렌더링 정확도, 다국어 지원, 2K 해상도, 최대 8장 일관 생성 등 거의 모든 축에서 업그레이드됐고, Image Arena의 3개 부문(Text-to-Image, Single-Edit, Multi-Edit) 전부 1위를 차지했습니다.

Google Nano Banana 2와 비교하면 어떤가요?

두 모델 모두 "생성 전 생각하는" 추론 기반 구조를 공유합니다. 최신 Image Arena 리더보드에서는 gpt-image-2가 Nano Banana 2를 상당한 점수 차이로 제치고 1위를 차지했어요. 다만 Nano Banana 2는 Google Workspace와의 통합이 강점이라, 사용 환경에 따라 선택이 갈릴 수 있습니다.

Thinking 모드는 얼마나 느린가요?

일반 Instant 모드보다 수 초~수십 초 더 걸립니다. 다중 패널 만화처럼 복잡한 작업도 수 분 내에 완성되는 수준이라, 결과물 품질을 감안하면 충분히 쓸 만한 속도예요.

원문: Introducing ChatGPT Images 2.0 — OpenAI

참고: TechCrunch, The Decoder, VentureBeat