Рисуй, рассуждая: OpenAI представил новую визуальную модель Images 2.0

Опубликовано: 16:17

Автор

Юлия Чуракова

Пишущий редактор в Unisender

Images 2.0 интегрирована в ChatGPT. При активации режима рассуждений она способна искать информацию в интернете, генерировать несколько изображений на один запрос и проверять свои результаты.

В компании отметили, что новая модель лучше работает с языками без латинского алфавита, включая японский, корейский, китайский, хинди и бенгали. Сгенерированные тексты отображаются корректно и остаются связными.

Также Images 2.0 точнее передает детали и стили. Например, модель добавляет несовершенства для реалистичности изображений, лучше воспроизводит кинематографические сцены и пиксельную графику.

OpenAI наглядно показывает возможности новой модели

При этом модель пока может испытывать сложности с генерацией инструкций, например для оригами, головоломок или изображений с деталями на наклонных поверхностях.

Images 2.0 доступна пользователям ChatGPT и Codex. Режим с возможностями рассуждений могут использовать подписчики ChatGPT Plus, Pro и Business.

Почему это важно

OpenAI расширяет возможности искусственного интеллекта. Новое поколение рассуждающих (reasoning) ИИ-моделей может повысить точность генераций даже для сложных задач.

Источник: Код Дурова

ВКонтакте, Telegram