OpenAI가 2026년 4월 21일, ChatGPT Images 2.0을 공식 공개했습니다. 새 모델 이름은 gpt-image-2. 12시간 만에 Image Arena 리더보드 전 카테고리 1위를 +242점차로 차지했습니다. 핵심 변화는 세 가지 — 이미지 안의 한국어 글자 렌더링 정확도 대폭 상승, "생각하는" 추론 모드 도입, 무료 사용자에게도 즉시 모드 개방. DALL·E 2/3은 2026년 5월 12일 종료됩니다.
무엇이 바뀌었나 — 핵심 4가지
OpenAI 공식 블로그(2026-04-21)에 따르면, gpt-image-2는 이전 버전 대비 다음 영역에서 직접적인 개선이 있습니다.
한국어, 일본어, 중국어, 힌디어, 벵골어, 아랍어, 키릴 문자, 그리스 문자가 이미지 안에서 제대로 읽히는 형태로 출력됩니다. 이전 모델에서 한국어 썸네일이 깨져 나온 문제가 가장 크게 해소되었습니다.
OpenAI 첫 "이미지 생성 전 사고하는" 모델. 레이아웃 계획, 웹 검색 기반 정보 수집, 8장 일괄 생성, 결과물 재검증까지 모델 내부에서 처리합니다. 잡지 표지 수준의 다중 요소 구성도 가능.
최대 2K 해상도까지 지원. 정사각형 외에도 9:16 세로(숏폼 썸네일), 16:9 가로(유튜브 썸네일), 4:5(인스타그램) 등 비율 선택폭이 넓어졌습니다.
Instant Mode는 모든 ChatGPT 사용자(무료 포함)에게 개방. Thinking Mode(웹검색·8장 배치·자동 검증)는 Plus·Pro·Business·Enterprise 구독자만 사용 가능. API에서도 동일.
한국 크리에이터에게 의미가 큰 이유
이전까지 한국어 썸네일을 AI로 만들려면 두 가지 우회로가 필요했습니다.
or 미드저니로 배경만 → 한글 폰트 별도 합성
= 한 장당 30~60분
→ 한 번의 프롬프트로 8장 일괄
= 한 장당 1~2분
실무 임팩트가 가장 큰 작업 3가지:
- ① 유튜브 썸네일 — 한글 굵은 글자 + 강한 배경. 시안 8장을 한 번에 받고 가장 좋은 것 선택.
- ② 인스타그램 캐럿셀 카드 — 10장 카드뉴스의 텍스트 디자인을 모델이 일관된 톤으로 생성.
- ③ 틱톡·릴스 정지화면 인트로 — 9:16 세로 비율 + 한글 자막이 한 컷에 합성된 형태로 출력.
가격과 사용 한계
모드별로 제한이 다릅니다.
- Instant Mode (무료) — 모든 사용자 사용 가능. 일일 생성 횟수에 제한이 있고, Thinking Mode 기능은 사용 불가.
- Thinking Mode (Plus, $20/월) — 웹 검색, 레이아웃 추론, 8장 배치, 결과 재검증 사용 가능. 일일 한도가 더 높음.
- Pro ($200/월) — Thinking Mode 거의 무제한 + 우선 처리.
- API — gpt-image-2 모델 ID로 직접 호출. 토큰·해상도별 과금.
OpenAI는 같은 발표에서 DALL·E 2와 DALL·E 3을 2026년 5월 12일에 종료한다고 알렸습니다. 기존 자동화 워크플로에 DALL·E API를 쓰고 있는 경우 약 3주 내 마이그레이션이 필요합니다.
- 한국어 정확도가 완벽하지는 않습니다. 짧은 단어·헤드라인은 안정적이지만, 긴 문장은 여전히 자모 오류가 발생할 수 있어 발행 전 육안 검수 권장.
- 저작권 정책은 종전과 동일. 실존 인물 얼굴, 브랜드 로고 직접 생성은 여전히 제한. 이미지 출처 표기는 사용자의 책임.
DALL·E 사용 워크플로의 마이그레이션 전략
현재 자동화 파이프라인에서 DALL·E API를 호출 중이라면, 2026년 5월 12일 종료 시점까지 약 3주가 남았습니다. 점검할 항목은 세 가지입니다.
① 모델 ID 교체 — 가장 단순한 변경.
기존 호출에서 dall-e-3 또는 dall-e-2 로 지정한 모델 파라미터를 gpt-image-2 로 바꾸면 즉시 동작합니다. 응답 스키마는 동일한 형태를 유지하므로 후처리 코드 수정은 거의 없습니다.
② 프롬프트 재작성 — 한 번 손봐야 합니다.
gpt-image-2는 레이아웃 지시를 더 정확히 따르기 때문에, DALL·E용으로 단순하게 적었던 프롬프트는 새 모델의 강점을 살리지 못합니다. 다국어 텍스트가 들어가는 썸네일이라면 글자 위치, 폰트 굵기, 배경 색까지 명시하면 결과 품질이 크게 향상됩니다.
③ 비용 시뮬레이션 — 해상도가 비용을 결정합니다.
Instant Mode 호출은 DALL·E 3 대비 비용이 비슷하거나 약간 낮은 구간이며, Thinking Mode는 토큰·해상도가 늘어나면서 비용이 더 듭니다. 월 1,000장 이상 자동화 워크플로의 경우 Instant 위주로 구성하고, 헤드라인 썸네일만 Thinking Mode로 분리하는 하이브리드가 비용 효율적입니다.
지금 바로 확인하는 법
업데이트가 본인 계정에 적용됐는지 확인하는 절차입니다.
- 1️⃣ chat.openai.com 접속 → 새 채팅
- 2️⃣ "한국어로 'AI 유튜브 시작' 텍스트가 들어간 16:9 썸네일 8장 만들어줘" 입력
- 3️⃣ 8장이 한 번에 출력되면 → Thinking Mode 적용 (Plus 이상)
- 4️⃣ 한 장씩 나오면 → Instant Mode 단계 (무료 포함 모든 사용자)
- 5️⃣ API 사용자는 모델 ID
gpt-image-2로 호출 가능
- OpenAI가 2026-04-21 ChatGPT Images 2.0 (gpt-image-2) 공식 공개
- 한국어·일본어·중국어 등 비라틴 문자 렌더링 대폭 개선 — 한국 크리에이터 썸네일 작업 시간 단축의 직접 사유
- Instant Mode는 무료, Thinking Mode는 Plus($20/월) 이상. 8장 일괄 생성·웹 검색·자가 검증은 Thinking 전용
- DALL·E 2/3은 2026-05-12 종료 — DALL·E API 사용 워크플로는 3주 내 마이그레이션 필요
- OpenAI (2026-04-21) — Introducing ChatGPT Images 2.0
- MacRumors (2026-04-22) — OpenAI Launches ChatGPT Images 2.0 With Thinking Capabilities and Better Text Rendering
- PetaPixel (2026-04-21) — OpenAI Claims ChatGPT Images 2.0 Can Think
- 9to5Mac (2026-04-21) — OpenAI unveils ChatGPT Images 2 image-gen model capable of magazine design