Elisaffeta • 22 апреля 2026

GPT Image 2 вышла — что умеет новая модель ИИ от OpenAI [апрель 2026]

Nano Banana
GPT Image 2 вышла — что умеет новая модель ИИ от OpenAI [апрель 2026]

GPT Image 2 вышла официально. 21 апреля 2026 года OpenAI выпустила новое поколение своего генератора изображений - без громкого пресс-релиза, без конференции, просто появилась в ChatGPT для подписчиков Plus и Pro. Текст на изображениях наконец работает правильно, жёлтый оттенок который раздражал всех убрали, реализм вышел на уровень профессиональной съёмки.

Разберём по порядку: что случилось на LM Arena в начале апреля, пять улучшений которые получила модель, как новая GPT-Image-2 работает с текстом и реализмом, и что это значит на практике. Плюс - 10 готовых промптов под разные задачи, чтобы сразу было что пробовать.


Что такое GPT Image 2 и чем она отличается от прошлой версии

GPT Image 2 - преемник GPT Image 1.5, который OpenAI выпустила в декабре 2025 года. Если GPT Image 1.5 был апгрейдом существующей архитектуры, то GPT Image 2 - это полностью переписанная модель с другой базой под капотом. Главное для обычного пользователя: текст на изображениях больше не разваливается в нечитаемую кашу, а цвета наконец перестали уходить в жёлтый оттенок.

Её уже ищут как «ГПТ Имидж 2», «chat gpt image 2» и «GPT-Image-2» - это одна и та же модель, просто разные варианты написания. Официальное название - GPT Image 2, доступна в ChatGPT Plus и Pro.


История серии GPT Image - от DALL-E до новой модели

Чтобы понять, почему GPT Image 2 - это событие, нужен контекст. OpenAI занималась генерацией изображений с 2021 года, но первые версии DALL-E были отдельными инструментами - слабо связанными с основным чатом. Переломный момент случился в марте 2025.

Модель Дата Что изменилось
DALL-E 3 Октябрь 2023 Диффузионная модель, интегрирована в ChatGPT
GPT Image 1 25 марта 2025 Первая авторегрессивная модель внутри ChatGPT. Вирусный Ghibli-эффект
GPT Image 1.5 16 декабря 2025 В 4 раза быстрее предшественника, на 20% дешевле по API, лидерство на LM Arena
GPT Image 2 21 апреля 2026 Новая архитектура, 99%+ точность текста, нейтральная цветопередача

DALL-E 2 и DALL-E 3 официально отключаются 12 мая 2026 года. OpenAI успела: GPT Image 2 вышла за три недели до дедлайна.

Авторегрессивная генерация - это когда модель создаёт изображение «токен за токеном», как текст. В отличие от диффузионных моделей (DALL-E, Stable Diffusion), которые начинают с шума и постепенно «проявляют» картинку. Авторегрессия даёт лучшее следование инструкциям и более точную передачу деталей.


Как обнаружили GPT Image 2 - история утечки апреля 2026

4 апреля 2026 года на платформе LM Arena появились три анонимных модели с кодовыми именами: maskingtape-alpha, gaffertape-alpha и packingtape-alpha. Все из серии скотч-лент. LM Arena - это площадка для слепых сравнений ИИ-моделей, где пользователи голосуют за лучший результат, не зная, какая модель его сгенерировала.

Первым на аномалию обратил внимание разработчик Питер Левелс: по его словам, качество было заметно выше всего, что он видел на этой платформе. Модель gaffertape-alpha набрала пиковый рейтинг Elo около 1385 пунктов - примерно на 215 пунктов выше предыдущего лидера. Через несколько часов все три модели исчезли с платформы.

Сообщество сразу поняло: это OpenAI. Идентичный паттерн уже был в декабре 2025, когда GPT Image 1.5 тестировалась под кодовыми именами Chestnut и Hazelnut - за несколько недель до официального релиза. Три одновременных варианта говорят о финальном сравнении кандидатов, а не о раннем прототипировании.

Параллельно начались сообщения от пользователей ChatGPT Plus и Pro: часть из них стала получать заметно более качественные изображения в обычных сессиях - без предупреждений и объяснений. Это был A/B-тест, который OpenAI тихо разворачивала с 19 апреля. Сегодня, 21 апреля 2026 года, GPT Image 2 стала доступна официально.


5 главных улучшений GPT Image 2 — что изменилось

Ниже - только конкретика из тестов и первых реальных сессий.

Текст на изображениях работает почти идеально

Это главный прорыв. GPT Image 1.5 давала 90-95% точности текста - звучит неплохо, но на практике это означало регулярные опечатки, перевёрнутые буквы и расплывшиеся надписи на вывесках. GPT Image 2 тестировщики оценивают в 99%+ по точности.

Что работает теперь:

  • Вывески и таблички - уличные надписи, меню, этикетки на продуктах отображаются корректно
  • UI-элементы - кнопки, меню, заголовки приложений практически как настоящие скриншоты
  • Комиксные пузыри - текст читается, буквы не распадаются
  • Часы - стрелки указывают ровно на заданное время, а не на произвольное
  • Код - небольшие сниппеты отображаются синтаксически корректно
  • Китайский, японский, корейский - CJK-символы значительно улучшены по сравнению с предыдущим поколением

Проверочный тест, который провалили все предыдущие модели: нарисовать часы с конкретным временем. GPT Image 2 справилась, GPT Image 1.5 - нет.

Убрали жёлтый цветовой сдвиг

GPT Image 1 и 1.5 имели характерный тёплый оттенок - все изображения уходили в жёлтый. Это было видно на белых поверхностях, светлых тонах кожи и нейтральных фонах. В GPT Image 2 цветопередача нейтральная: белый выглядит белым, а цвета соответствуют тому, что описано в промпте.

Это критично для продуктовой съёмки: правильная белая подложка без оттенков - базовое требование для карточек на маркетплейсах.

Фотореализм и «знание мира»

Ключевое отличие GPT Image 2 от предыдущих поколений - модель не просто «интерпретирует» промпт, а опирается на реальные знания об объекте. Различие на практике:

Тест GPT Image 2 GPT Image 1.5
Витрина IKEA ночью Правильные архитектурные детали, фирменный стиль Приблизительная имитация
YouTube-интерфейс Почти точный скриншот Элементы смещены, шрифты не те
Интерфейс Windows Корректные иконки и расположение Стилизованные неточности
Minecraft-скриншот Правильный in-game интерфейс и арт-стиль Пиксельный, но с искажениями
Руки и анатомия Высокая точность Периодические ошибки

Тестировщики сравнивали портреты GPT Image 2 с реальными фотографиями - визуальной разницы практически нет.

Новая архитектура — теперь отдельная модель

Технический момент, который влияет на качество и скорость. GPT Image 1 и 1.5 работали как надстройка над GPT-4o: сначала языковая модель обрабатывала промпт, потом отдельный пайплайн генерировал изображение. Два этапа, два узких места.

GPT Image 2 - полностью самостоятельная модель. Это подтвердили через метаданные PNG-файлов: теги генерации совпадают с неопубликованными API-строками. Переход с двухэтапного инференса на одноходовой дал и рост качества, и ожидаемое ускорение.

Инференс - это процесс «работы» модели при генерации, то есть время от отправки промпта до получения результата. Одноходовой инференс = меньше задержка, меньше точек для ошибок.

Скорость генерации - менее 3 секунд против 8-12 у GPT Image 1.5.

Новые форматы и разрешение

Параметр GPT Image 1.5 GPT Image 2
Максимальное разрешение 1536x1024 2048x2048+
Соотношения сторон 1:1, 3:2, 2:3 + 16:9 подтверждено
Скорость 8-12 секунд Менее 3 секунд
Точность текста ~90-95% ~99%+

Формат 16:9 - это стандарт для YouTube-превью, баннеров и горизонтальных рекламных креативов. Его добавление означает, что GPT Image 2 становится инструментом для маркетинговых материалов без дополнительного кадрирования.


GPT Image 2 против конкурентов - что показывают слепые тесты

На LM Arena тестировщики сравнивали анонимные «ленточные» модели вслепую - не зная, какая модель что генерирует. Результаты устойчивые по нескольким сессиям.

Конкурент Сильные стороны Позиция против GPT Image 2
Midjourney V7 Художественное качество, эстетика GPT Image 2 лучше по тексту и следованию промптам. Midjourney сильнее в арт-стиле и визуальной эстетике
Топовые модели Google Скорость, качество портретов GPT Image 2 обходит по реализму, точности текста и «знанию мира». Модели Google лидируют в рейтинге text-to-image на LM Arena по состоянию на 9 апреля 2026
FLUX.2 Open-source, гибкость настройки Больше контроля для разработчиков, но GPT Image 2 лучше интегрирована в чат и следует инструкциям
Adobe Firefly Корпоративная безопасность, лицензионная чистота Firefly для B2B с жёсткими требованиями. GPT Image 2 - универсальный инструмент

Важный нюанс по сравнению с топовыми моделями Google: по состоянию на 9 апреля 2026, в рейтинге text-to-image на LM Arena первое место занимала Google (модель gemini-3.1-flash-image-preview), GPT Image 1.5 - второе. «Ленточные» модели обошли обоих. Для OpenAI это была принципиальная проверка.


GPT Image 2 вышла — где доступна и как попробовать

21 апреля 2026 года. Сегодня. Без анонса, без пресс-конференции - просто появилась в интерфейсе ChatGPT для подписчиков Plus и Pro. OpenAI так и не написала твит. Зато пользователи уже сравнивают результаты и постят в Twitter и Reddit.

Доступ прямо сейчас: ChatGPT Plus ($20/мес) или Pro ($200/мес). Через API - ждём отдельного объявления, обычно выходит в течение нескольких дней после релиза в чате. Предполагаемая цена API: $0.15-0.20 за изображение в стандартном качестве.

Для тех, кто ищет «chat gpt image 2 вышла бесплатно» - Free-план пока не получил доступ. Бесплатные пользователи, как и в случае с GPT Image 1.5, получат ограниченный доступ позже.

Пока разбираетесь с подпиской или хотите попробовать ИИ-генерацию изображений прямо сейчас - это можно сделать на GoBanana.ru или в Telegram-боте @nanobananas_bot. Без VPN, оплата картой РФ, три бесплатных генерации сразу после регистрации.


10 промптов для GPT Image 2 - тест на максимум возможностей

Эти промпты составлены под реальные задачи, актуальные для российского рынка. Текст в сценах - на русском, маркетплейс - Wildberries, интерфейсы - привычные. Каждый промпт тестирует конкретную возможность GPT Image 2, которой не было у предыдущих моделей. Пишем на английском - так точнее - но все текстовые элементы внутри изображений задаём по-русски.


Промпт 1 - Вывеска на русском Тестируем: точность кириллицы в реальной сцене

A cozy Russian coffee shop storefront on a Moscow side street, golden hour light. Hand-painted wooden sign above the entrance reads exactly: "Кофе и книги — с 2019". Warm brick wall, potted plants by the door, soft cafe glow through the window. Photorealistic, 35mm film aesthetic.

Почему этот промпт: старые модели разваливали кириллицу в нечитаемый набор символов. GPT Image 2 должна воспроизвести надпись дословно - включая дефис и год.


Промпт 2 - Часы с конкретным временем Тестируем: «знание мира» и работу с деталями

A luxury Swiss wristwatch lying on dark matte leather. The watch face clearly shows exactly 10:10. Close-up macro shot, shallow depth of field, studio lighting with subtle reflections on the glass. Photorealistic, product photography style.

Почему этот промпт: правильное положение стрелок - классический тест на то, понимает ли модель объект или просто копирует текстуру. Все модели до GPT Image 2 регулярно проваливали этот тест.


Промпт 3 - Скриншот ВКонтакте Тестируем: «знание мира» на уровне реального интерфейса

A realistic screenshot of a VKontakte community page on a laptop screen. The community name reads "Кулинарные рецепты". Visible: cover photo with food, subscriber count "248 тыс. подписчиков", pinned post with a photo of borscht, like and comment buttons with Russian labels. The UI matches the real VKontakte interface exactly, light theme.

Почему этот промпт: воссоздание реального интерфейса - это не «нарисовать похожее», а точное воспроизведение с правильными кнопками, шрифтами и расположением. ВКонтакте - идеальный тест для российской аудитории.


Промпт 4 - Карточка товара для Wildberries Тестируем: белый фон без желтизны + русский текст на упаковке

Professional product photo of a matte black thermos 500ml on a pure white background. Even studio lighting, no shadows, absolutely no yellow color cast, white is truly white. The thermos label reads "Термос Арктик 500 мл" in clean Russian sans-serif font. Suitable for Wildberries product card, high resolution, e-commerce catalog style.

Почему этот промпт: нейтральный белый - базовое требование Wildberries для карточек. GPT Image 1.5 стабильно давала жёлтый оттенок. Здесь проверяем конкретное исправление + русский текст на этикетке.


Промпт 5 - Нейрофотосессия, портрет Тестируем: фотореализм, лицо и руки

A candid portrait of a 28-year-old Russian woman sitting at a cafe table near a large window. Natural afternoon light from the left. She holds a ceramic cup with both hands, slight smile, relaxed expression. Wearing a light beige turtleneck. Sharp focus on her face and hands. Background softly blurred, warm interior. Canon 85mm f/1.4 lens aesthetic. Photorealistic.

Почему этот промпт: руки и лица - исторически самые сложные элементы для ИИ-генераторов. GPT Image 2 заметно улучшила оба аспекта. Сценарий типичный для нейрофотосессий.


Промпт 6 - Комикс с русским диалогом Тестируем: несколько текстовых элементов в одной сцене

A single-panel comic strip, clean bold cartoon style. Scene: a fluffy orange cat sits on a keyboard, looking smug. Speech bubble above the cat says: "Я работаю." A tired person at the desk has a thought bubble: "Это не работа..." Bold outlines, flat colors, simple modern illustration style. All text in Russian, readable and correct.

Почему этот промпт: два независимых текстовых блока на русском, разные типы пузырей - это предел предыдущих моделей. Плюс понятный российский мем-контекст.


Промпт 7 - Уличная сцена с кириллическими вывесками Тестируем: несколько вывесок, ночная съёмка, атмосфера

A rainy Moscow side street at night, viewed from the second floor. Below: lit storefronts with Russian signs - "Аптека 24 часа" in green neon, "Пекарня" in warm yellow letters, "Продукты" in white on red background. Reflections in wet asphalt. Cinematic composition, film grain, photorealistic, moody atmosphere.

Почему этот промпт: три разных вывески в одной сцене на кириллице, разные стили - максимальная нагрузка на текстовую точность в атмосферном кадре.


Промпт 8 - Баннер для Instagram на русском Тестируем: текст + дизайн-макет в маркетинговом формате

A social media banner for a Russian bakery, 4:5 vertical format for Instagram. Warm blurred background with fresh pastries. Large centered Russian text: "Свежая выпечка каждое утро". Smaller text below: "Заказ до 8:00 — доставка к 9:00". Clean modern typography, muted beige and warm brown palette, minimal design, suitable for Instagram feed post.

Почему этот промпт: реальный кейс для SMM-специалиста. Иерархия текста на русском, цветовая схема, вертикальный формат 4:5 - всё должно работать вместе без ошибок в словах.


Промпт 9 - Этикетка продукта с составомТестируем: мелкий структурированный русский текст

A product label for a Russian craft jam jar, flat lay on white background. The label has a clean vintage design. Top text: "Варенье из клубники". Center: illustrated strawberry. Bottom section: small text block reading "Состав: клубника, сахар, лимонная кислота. Без консервантов. 300 г". Craft paper texture label, warm red and green colors. Product photography style.

Почему этот промпт: мелкий структурированный текст на русском - состав, вес, пометки. Именно такой контент нужен для упаковки и карточек маркетплейса.


Промпт 10 - Рецептурная карточкаТестируем: сложная композиция с несколькими текстовыми блоками

A clean recipe card layout for Russian borscht. Cream background, classic illustration style. Top: large bold Russian text "БОРЩ КЛАССИЧЕСКИЙ". Left column: "ИНГРЕДИЕНТЫ" header with 5-item list in Russian: свёкла, капуста, картофель, говядина, томатная паста. Right side: appetizing top-down photo of a bowl of borscht with sour cream. Footer: "6 порций · 1 час 40 минут". Elegant cookbook design, all text in Russian, no errors.

Почему этот промпт: пять независимых текстовых блоков в структурированном макете на русском. Проверяем, удерживает ли модель типографику и читаемость одновременно на нескольких уровнях.


Как правильно писать промпты для GPT Image 2

Короткий промпт работает хуже. GPT Image 2 обучена воспринимать детализированные инструкции - чем конкретнее, тем точнее результат. Несколько правил, которые подтвердились в тестах:

Указывай стиль съёмки. «Photorealistic, 35mm film» или «product photography, studio lighting» задают тип рендера. Без этого модель выбирает стиль сама.

Называй конкретные детали, которые важны. Если нужен точный текст на изображении - пиши его в кавычках прямо в промпте и добавь «exactly» или «reads:».

Описывай свет. «Natural afternoon light from the right», «soft studio lighting, no harsh shadows» - свет меняет итог кардинально.

Указывай технику. «Canon 85mm f/1.4», «anamorphic lens flare», «macro shot» - GPT Image 2 понимает фотографические термины и применяет их.

Для маркетплейс-съёмки - всегда добавляй «pure white background, no color cast, even lighting». Это прямо адресует улучшение, которое сделали в GPT Image 2.


Частые вопросы о GPT Image 2

GPT Image 2 уже вышла? Да, вышла 21 апреля 2026 года. Доступна в ChatGPT для подписчиков Plus и Pro. OpenAI не делала официального анонса - модель просто появилась в интерфейсе. API-доступ ожидается в ближайшие дни.

Чем GPT Image 2 отличается от ChatGPT Image 1.5? Три ключевых отличия: точность текста выросла с 90-95% до 99%+, убран жёлтый цветовой перекос который портил нейтральные тона, новая архитектура обеспечивает лучший реализм и скорость. Технически это отдельная модель, а не апгрейд старой.

Что такое GPT-Image-2 в контексте DALL-E? GPT-Image-2 заменяет DALL-E полностью. DALL-E 2 и DALL-E 3 отключаются 12 мая 2026 года - разработчики, которые используют их через API, обязаны мигрировать на новые модели.

Сколько стоит GPT Image 2? Для подписчиков ChatGPT Plus ($20/мес) и Pro ($200/мес) - входит в подписку. API-цена пока официально не объявлена, аналитики прогнозируют $0.15-0.20 за изображение в стандартном качестве.

Где попробовать ИИ-генерацию изображений без ChatGPT? На GoBanana.ru или в Telegram-боте @nanobananas_bot - без VPN, с оплатой картой РФ. Три бесплатных генерации при регистрации, результат за секунды.

Что такое LM Arena и почему важна утечка оттуда? LM Arena (бывший Chatbot Arena) - это независимая платформа для слепого сравнения ИИ-моделей. Пользователи голосуют за лучший результат, не зная, какая модель его создала. Это самый честный бенчмарк в индустрии: нельзя накрутить. Появление «ленточных» моделей с рекордным Elo 1385 в начале апреля стало главным сигналом перед релизом.


Глоссарий — термины из статьи простым языком

GPT Image 2 - новая модель генерации изображений от OpenAI, вышла 21 апреля 2026 года. Официальное название: GPT Image 2, в народе также называют GPT-Image-2, ГПТ Имидж 2, chat gpt image 2.

Text-to-image - технология создания изображений по текстовому описанию. Пишешь промпт - получаешь картинку.

Промпт - текстовое задание для ИИ-модели. Чем точнее и детальнее, тем лучше результат.

Авторегрессивная модель - тип ИИ, который создаёт изображение «токен за токеном», как текст. Так работают GPT Image 1, 1.5 и 2. В отличие от диффузионных моделей (DALL-E, Stable Diffusion), которые начинают с шума и постепенно «проявляют» изображение.

Диффузионная модель - предыдущее поколение ИИ-генераторов. Начинает с зашумлённого изображения и убирает шум шаг за шагом. DALL-E 3 работал именно так.

Инференс - процесс работы модели при генерации, то есть время от отправки промпта до получения результата. Одноходовой инференс у GPT Image 2 означает, что модель делает это за один проход вместо двух.

LM Arena - независимая платформа для слепого сравнения ИИ-моделей. Пользователи голосуют за лучший результат, не зная, какая модель его сгенерировала. Самый честный бенчмарк: нельзя накрутить рейтинг рекламой.

Elo-рейтинг - система оценки силы, заимствованная из шахмат. Чем больше Elo, тем лучше модель в слепых сравнениях. «Ленточные» модели набрали Elo 1385 - примерно на 215 пунктов выше предыдущего лидера.

A/B-тест - когда часть пользователей получает старую версию продукта, часть - новую, и компания сравнивает результаты. OpenAI использовала A/B-тест перед релизом GPT Image 2.

API - программный интерфейс, через который разработчики подключают ИИ-модель к своим приложениям. GPT Image 2 появится в API OpenAI в ближайшие дни после релиза.

Фотореализм - качество изображения, при котором ИИ-рендер неотличим от настоящей фотографии. GPT Image 2 по отчётам тестировщиков достигла этого уровня на портретах и предметной съёмке.

Цветовой перекос - систематический сдвиг цветов изображения в одну сторону. У GPT Image 1 и 1.5 был характерный жёлтый перекос - все белые поверхности уходили в тёплый оттенок. В GPT Image 2 убрали.

DALL-E - предыдущая серия ИИ-генераторов от OpenAI. DALL-E 2 и 3 отключаются 12 мая 2026 года. GPT Image 2 - их официальная замена.


Об авторах

Елисавета Наговицына - co-founder и CPO GoBanana.ru. Занимается продуктовой стратегией, контент-маркетингом и SEO. Создала систему продвижения, которая обеспечивает 86% трафика из поисковых систем без рекламного бюджета. Co-founder Neuroscribe - питчила перед ВТБ, Сбербанком, финал всероссийского стартап-конкурса. Эксперт по ИИ-инструментам с 2021 года, автор 1700+ SEO-статей.

Telegram: @elisaffetta

Максим Наговицын - co-founder и CTO GoBanana.ru. Маркетинг-стратег с 10+ годами в digital и IT-предприниматель. Разработал платформу через вайб-кодинг - AI-ассистированное программирование - без классического бэкграунда в разработке. Другие проекты: Neuroscribe (54 000+ пользователей), VibeCoderz. Автор канала про ИИ, маркетинг и создание продуктов.

Telegram-канал: @neuromaximru



110 задач, которые можно делегировать ИИ
Генерация контента
нейросеть пишет текст
Чат с нейросетью
нейросеть для картинок
Транскрибация нейросеть
Neuroscribe Telegram

Комментарии ( 0)

Пожалуйста войдите чтобы оставить комментарий.

Присоединяйся к Нейроскрайб

Начни создавать уникальный контент с помощью нейросетей уже сегодня и стань более продуктивным, получив время на личную жизнь и близких 💙

Начать бесплатно
58020+ создателей контента уже используют Нейроскрайб

🍪 Файлы Cookie

Этот веб-сайт использует файлы cookie, чтобы обеспечить вам максимальное удобство на нашем веб-сайте. Политика в отношении файлов cookie

Принимаю