Рисуй, рассуждая: OpenAI представил новую визуальную модель Images 2.0
Images 2.0 интегрирована в ChatGPT. При активации режима рассуждений она способна искать информацию в интернете, генерировать несколько изображений на один запрос и проверять свои результаты.
В компании отметили, что новая модель лучше работает с языками без латинского алфавита, включая японский, корейский, китайский, хинди и бенгали. Сгенерированные тексты отображаются корректно и остаются связными.
Также Images 2.0 точнее передает детали и стили. Например, модель добавляет несовершенства для реалистичности изображений, лучше воспроизводит кинематографические сцены и пиксельную графику.

При этом модель пока может испытывать сложности с генерацией инструкций, например для оригами, головоломок или изображений с деталями на наклонных поверхностях.
Images 2.0 доступна пользователям ChatGPT и Codex. Режим с возможностями рассуждений могут использовать подписчики ChatGPT Plus, Pro и Business.
Почему это важно
OpenAI расширяет возможности искусственного интеллекта. Новое поколение рассуждающих (reasoning) ИИ-моделей может повысить точность генераций даже для сложных задач.
Источник: Код Дурова