Рисуй, рассуждая: OpenAI представил новую визуальную модель Images 2.0

Images 2.0 интегрирована в ChatGPT. При активации режима рассуждений она способна искать информацию в интернете, генерировать несколько изображений на один запрос и проверять свои результаты.

В компании отметили, что новая модель лучше работает с языками без латинского алфавита, включая японский, корейский, китайский, хинди и бенгали. Сгенерированные тексты отображаются корректно и остаются связными.

Также Images 2.0 точнее передает детали и стили. Например, модель добавляет несовершенства для реалистичности изображений, лучше воспроизводит кинематографические сцены и пиксельную графику.

OpenAI наглядно показывает возможности новой модели
OpenAI наглядно показывает возможности новой модели

При этом модель пока может испытывать сложности с генерацией инструкций, например для оригами, головоломок или изображений с деталями на наклонных поверхностях.

Images 2.0 доступна пользователям ChatGPT и Codex. Режим с возможностями рассуждений могут использовать подписчики ChatGPT Plus, Pro и Business. 

Почему это важно

OpenAI расширяет возможности искусственного интеллекта. Новое поколение рассуждающих (reasoning) ИИ-моделей может повысить точность генераций даже для сложных задач. 

Источник: Код Дурова

Готовая рассылка за 15 минут ⏰ ООО «Юнисендер СМАРТ», ИНН 9731091240, erid: 2VSb5yQvAY2