Исходный размер 2480x3500

Pink Bar World

Проект принимает участие в конкурсе

Мне захотелось обучить генеративную нейросеть Stable Diffusion для генерации изображений в собственном визуальном стиле, разработанном для серии открыток для бара. Эти открытки выполнены в яркой розово-жёлтой цветовой гамме и изображают простых персонажей и объекты, связанные с барной культурой.

Главной идеей проекта стало не просто воспроизведение отдельных иллюстраций, а расширение этого стиля до целого мира — воображаемой вселенной, в которой барная эстетика становится основой архитектуры, природы и повседневной жизни.

Ссылка на проект

0
0
0
0

Основной целью было проверить, сможет ли нейросеть:

1. Воспроизвести мой визуальный стиль. 2. Сохранить цветовую палитру. 3. Передать упрощённую форму персонажей и объектов. 4. Адаптировать стиль к новым сюжетам, которых не было в исходных работах.

Идея

Если исходные работы — это отдельные открытки, то в проекте я развиваю их в целостный визуальный мир бара.

В этом мире здания сделаны из коктейлей и бокалов, природа состоит из трубочек, зонтиков и жидкостей. Персонажи живут внутри этой «барной среды». Привычные объекты переосмыслены как элементы архитектуры и ландшафта.

Использованные инструменты

  1. Stable Diffusion — обучение нейросети под собственный стиль
  2. DreamBooth LoRA — дообучение модели
  3. Google Colab — запуск и обучение
  4. Hugging Face — получение токена и работа с моделями

Датасет

Для обучения была собрана папка из моих собственных иллюстраций — открыток для бара.

Все изображения квадратные (1:1), выполнены в одной стилистике, используют ограниченную цветовую палитру, а также содержат простые, упрощённые формы.

Исходный размер 3500x2480

Особенности стиля

Стиль моих работ включает:

  1. Яркие розовые и жёлтые цвета.
  2. Минималистичные формы.
  3. Простых «человечков».
  4. Плоский цвет без сложных теней. декоративную композицию, близкую к открыткам.
Исходный размер 3273x1003

цветовая палитра

Процесс обучения

Сначала были установлены необходимые библиотеки и подготовлена среда в Google Colab.

Исходный размер 5070x900

Далее изображения были загружены в ноутбук и проверены. После этого был выполнен логин в Hugging Face.

Исходный размер 5070x2407

Обучение проводилось с использованием модели Stable Diffusion v1.5 и метода LoRA, что позволило быстро адаптировать модель под мой стиль.

Были выбраны параметры:

  1. разрешение 512.
  2. около 100 шагов обучения.
  3. небольшие батчи для стабильной работы в Colab.
Исходный размер 5070x2416

После завершения обучения была получена LoRA-модель, которая затем использовалась для генерации изображений.

Исходный размер 5070x2415

Генерация

Сначала были протестированы простые промпты, повторяющие исходные сюжеты.

Исходный размер 5070x978
Исходный размер 512x512

prompt = «illustration in pinkbarstyle, surreal bar city, buildings made of cocktails, bright pink and yellow colors»

После этого я перешла к более сложной задаче — генерации новых сцен, которых не было в датасете: город из коктейлей, улицы с домами-бокалами, природные ландшафты из барных элементов и т. д.

Исходный размер 5070x1846
Исходный размер 5070x1702
Исходный размер 5070x2304

Анализ результатов

Нейросети удалось хорошо передать: — цветовую палитру. — минималистичную форму объектов. — общий «плоский» стиль иллюстраций. — настроение и декоративность открыток.

Исходный размер 512x512
Исходный размер 512x512
Исходный размер 512x512
Исходный размер 512x512
Исходный размер 512x512
Исходный размер 512x512
Исходный размер 512x512
Исходный размер 512x512
Исходный размер 512x512
Исходный размер 512x512
Исходный размер 512x512
Исходный размер 512x512

При этом иногда появляются: — странные формы. — небольшие артефакты. — нестабильность композиции.

Однако это не мешает использовать генерации как инструмент для разработки идей.

Исходный размер 512x512
Исходный размер 512x512
Исходный размер 512x512

Концепция итоговой серии

Финальная серия изображений представляет собой визуальный мир бара, в котором:

архитектура, природа и предметы объединены одной логикой; стиль остаётся единым во всех сценах; каждое изображение — часть общей среды.

Таким образом, проект выходит за рамки иллюстраций и становится концепт-дизайном мира.

Вывод

Нейросеть не заменяет художника, но может быть полезным инструментом для генерации идей и для расширения собственного визуального языка.

В рамках проекта она выступает как способ развития авторского стиля, а не его замены.

Загрузка...
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше