Творчеством от искусственного интеллекта сегодня никого не удивишь. Но не каждый сервис позволяет делать картинки высокого качества, еще и в десятках разных стилей. Stable Diffusion — одна из самых продвинутых нейросетей для генерации изображений, доступная абсолютно бесплатно. Разбираемся, как работает онлайн-версия и что можно делать с ее помощью.
Бесплатная нейросеть Stable Diffusion: гид по работе с изображениями
Как работает Stable Diffusion
Stable Diffusion обучена более чем на 5 миллиардах пар «изображение-текст». Разработчики заложили в сервис много дополнительных возможностей, которые дают получить более точный результат: например, менять стиль, делать рамки. Кроме того, за счет использования техники Outpainting нейросеть умеет заполнять и расширять размер изображений, добавлять новые элементы к существующей картинке.
В основе Stable Diffusion такой принцип работы:
- Запомнив картинку при обучении, нейросеть емко фиксирует происходящее на ней через простой код — как мозаику из множества мелких кусочков (это называется латентное пространство).
- Затем Stable Diffusion добавляет к шум, делая изображение все более расплывчатым, пока оно не превратится практически в случайный набор пикселей (это и есть диффузия). Так ИИ анализирует структуру изображения.
- Благодаря обучению на огромном количестве примеров, модель может из «шума» восстановить картинку. Генерируя новое изображение с нуля, нейросеть постепенно добавляет к нему детали и «отматывает» шум в обратном направлении (это обратная диффузия).
Схематично процесс генерации выглядит примерно так:
Чем онлайн-версия отличается от десктопной
Stable Diffusion работает в браузерной и в десктопной версии. Онлайн-сервис имеет ограниченный функционал. Но здесь есть все основные опции: можно задать текстовый запрос, добавить отрицательный промпт, выбрать стиль. Также можно указать количество готовых вариантов — 1-2 на бесплатном тарифе и 4 в премиум-версии. По умолчанию размер сгенерированной картинки — 512×512 px, можно изменить соотношение сторон. Бесплатные генерации хранятся в течение 7 дней.
Чтобы генерировать картинки бесплатно, каждый пользователь после регистрации ежедневно получает по 10 кредитов — они позволяют создать 10 изображений. При этом на картинках в углу будет стоять водяной знак. Чтобы его убрать и увеличить количество генераций до 2000 – 4000 в месяц, нужно перейти на платный тариф. Стоимость начинается от $7 в месяц.
Десктопная версия полностью бесплатная, и ее возможности шире. Можно самостоятельно задавать размер изображения, уточнять запросы, выбирать количество шагов по созданию картинки, указывать уровень четкости, работать по референсам и многое другое. Главный минус — нужны хотя бы минимальные знания программирования. Необходимо установить Python и Git, скачать и распаковать архив с программой, найти и запустить подходящую модель (возможности разных моделей отличаются). При этом для корректной работы нейросети требуется соответствие устройства определенным характеристикам.
Windows | macOS |
Видеокарта NVIDIA от серии GeForce RTX 20xx | Процессор M1 или M2 |
16+ ГБ оперативной памяти | Последняя версия macOS Monterey |
4 ГБ видеопамяти |
Если у вас более слабый компьютер, десктопная версия может работать, но будет тормозить.
Работа идет через командную строку. Но можно использовать графический интерфейс, от Automatic1111, он доступен для Windows.
Существуют также более простые пользовательские приложения со Stable Diffusion для macOS — CHARL-E, DiffusionBee, Roll Art Die.
Мы остановимся на онлайн-версии с официального сайта Stable Diffusion. Никаких технических характеристик компьютера или специальных знаний она не требует, достаточно просто зарегистрироваться. Возможностей сервиса будет достаточно, чтобы создавать иллюстрации для постов и баннеров, дорисовывать собственные изображения или генерировать себе референсы и эскизы для дальнейшей доработки.
Как генерировать изображения
Шаг 1. Зарегистрируйтесь на сайте и авторизуйтесь. В правом верхнем углу интерфейса можно выбрать язык и кликнуть на кнопку «Начать».
Шаг 2. В верхнем поле укажите текстовый запрос на английском языке. Вы можете написать промпт на русском, а затем перевести его с помощью онлайн-переводчика и вставить в поле.
Шаг 3. При необходимости, добавьте отрицательный запрос. В этом поле напишите то, чего не должно быть на изображении. Просто перечислите предметы или явления, которые нейросеть не должна использовать. Запрос также пишите на английском языке.
Шаг 4. Выберите стиль. Всего доступно 24 варианта, а если никакой стиль не нужен, кликайте по зачеркнутому кругу с надписью «Нет». При выборе стиля длина промпта не должна превышать 10 слов.
Шаг 5. Укажите соотношение сторон. По умолчанию выбран вариант 1:1, что соответствует картинке размером 512×512. Но вы можете изменить соотношение от 12:5 до 5:12.
Шаг 6. Выберите количество результатов. В бесплатной версии можно указать 1 или 2 варианта. Одно изображение будет стоить один кредит.
Шаг 7. Укажите расширенные настройки, если нужно. Здесь можно задать масштаб направления, он влияет на точность учета промпта. По умолчанию стоит значение 7 — оно позволяет исключить и вероятность полного несоответствия запросу, и риск слишком буквальной трактовки промпта.
Также можно использовать фиксированный сид — вести работу от некой исходной точки. При включении этой опции нейросеть будет генерировать похожие картинки по одному запросу. Если хотите получать кардинально разные изображения, просто не ставьте флажок.
Шаг 8. Кликните на кнопку «Создать».
Дождитесь завершения генерации. Обработка длится менее минуты.
Шаг 9. Посмотрите готовые изображения. Если не получилось создать нужную картинку, попробуйте изменить промпт и отрицательный запрос.
Шаг 10. Скачайте понравившийся вариант. Для этого кликните на картинку. Под ней будут кнопки для скачивания, копирования или отправки результата в соцсети.
Самое сложное — составление правильного промпта. Важно как можно подробнее описать картинку — детали объекта, цвета, особенности предметов. Используйте короткие предложения или словосочетания, перечисляя их через запятую. Допустимая длина запроса — до 500 символов.
В промпте для Stable Diffusion наибольший вес имеют первые слова. Поэтому важно соблюсти определенный порядок слов. Примерная схема: объект + основные характеристики объекта + окружающая среда + дополнительные детали изображения + освещение/цветовая гамма.
Если важно наличие определенной детали на картинке, соответствующую часть промпта можно написать в круглых скобках — (часть запроса). Также узнать больше хитростей о составлении промптов можно в официальном гайде сервиса.
Неплохое решение — воспользоваться готовыми промптами и сервисами для их генерации. Например:
- База подсказок от Stable Diffusion. В поисковой строке напишите основной запрос, выберите наиболее подходящее изображение и посмотрите, какой запрос использован для ее генерации.
- Public Prompts. Это публичная библиотека промптов, которые отсортированы по категориям. Выберите категорию и скопируйте понравившийся запрос.
- PromptoMania. Здесь можно создать грамотный запрос на основе подсказок и референсов.
- Stable Diffusion Prompt Generator. Это сервис для улучшения промпта. Введите свой запрос и получите улучшенный вариант. э
Если хотите научиться лучше формулировать запросы для разных нейросетей, воспользуйтесь нашим руководством по составлению промптов.
Дополнительные функции
С помощью дополнительного функционала нейросети можно упростить работу с изображениями. Рассмотрим все возможности, доступные онлайн.
Изображение в изображении. Позволяет добавлять новые объекты в ваши иллюстрации и фотографии. Загрузите картинку или перетащите файл в верхнее поле. Укажите промпт — что нужно изменить или доработать на изображении. Впишите отрицательный запрос. Укажите настройки — стиль, количество изображений, соотношений сторон — и запустите генерацию.
Инструмент отлично подойдет, если нужно видоизменить изображение, добавить какие-то детали. Эта функция расходует кредиты так же, как и генерация картинок с нуля.
Удаление фона (Background Remover). Нейросеть определяет предметы на первом плане и удаляет все лишнее. Инструмент умеет обрабатывать картинки с несколькими объектами. Функция доступна бесплатно без ограничений, кредиты не расходуются.
Волшебный ластик (Magic Eraser). Позволяет быстро удалить лишние детали на картинке. Загрузите картинку. Затем в открывшемся редакторе выделите детали для удаления и нажмите «Стереть». На бесплатном тарифе функция доступна за кредиты. При этом нельзя обрабатывать изображения в HD-качестве. Нейросеть попросит снизить качество картинки или перейти на премиум-версию.
Редактировать что угодно (Edit Anything). В этом разделе пользователям доступен умный AI-редактор. С его помощью можно варьировать цветовую гамму или изменять отдельные части картинки.
Кстати, запросы в данном случае можно сформулировать по-русски. Стоимость одной итерации в бесплатной версии составляет 2 кредита. Редактирование HD-изображений также доступно только на платном тарифе.
Масштабирование изображений (Image Upscaler). Можно увеличить изображение без потери качества на 200% за 2 кредита или 400% за 4 кредита. Просто загрузите картинку и кликните на кнопку «Высококлассный» (в русскоязычной версии у некоторых кнопок такие забавные названия). Бесплатно пользователь может масштабировать исходные изображения не больше 5 МБ или 1024 пикселей.
Эскиз в изображение (Sketch to Image). Эта функция позволит вам почувствовать себя художником.. В редакторе нарисуйте эскиз — это может быть просто схематичный набросок. Дополнительно можно задать фон, добавить геометрические фигуры и текст. Также можно загрузить готовый эскиз.
Для получения более качественного результата добавьте подсказку и выберите стиль. Здесь также можно писать промпты на русском языке. Стоимость одной генерации в бесплатной версии равна одному кредиту.
Смена лица онлайн (Face Swap Online). Это новая функция, реализованная на отдельной платформе. Поэтому для использования сервиса потребуется дополнительная регистрация. Инструмент позволяет заменить лицо на фото или видео. Необходимо загрузить исходный файл и добавить картинку лица, которое нужно добавить. Можно загружать групповые снимки или видео и менять в них лица. Бесплатная версия позволяет создавать 10 изображений и 3 видео в месяц. Платный тариф начинается от $7 в месяц и увеличивает количество изображений до 500+.
Stable Diffusion предоставляет широкие возможности для работы с изображениями. С ее помощью можно сгенерировать референс для мудборда или иллюстрацию для поста, быстро отретушировать фото для заставки на сайте или вырезать товар из фона для карточки в интернет-магазине. Пробуйте и экспериментируйте: даже если сгенерированные иллюстрации не подойдут к вашему фирменному стилю, дополнительные функции сервиса как минимум позволят автоматизировать рутину.
СВЕЖИЕ СТАТЬИ
Другие материалы из этой рубрики
Не пропускайте новые статьи
Подписывайтесь на соцсети
Делимся новостями и свежими статьями, рассказываем о новинках сервиса
«Честно» — авторская рассылка от редакции Unisender
Искренние письма о работе и жизни. Свежие статьи из блога. Эксклюзивные кейсы и интервью с экспертами диджитала.