Original size 1140x1600

Обучение генеративной нейросети под стиль художника Эндрю Уайетта

PROTECT STATUS: not protected

(1) цель

Изучить возможности генеративных нейросетей и создать атмосферную серию изображений, вдохновлённую работами Эндрю Уайетта.

Картины авторства Эндрю Уайетта

Главная тема Уайетта — спокойная жизнь в провинции, которая, однако, не имеет ничего общего с традиционным реализмом.

Все, что изображает художник, создает ощущение недосказанности и невидимого присутствия силы, которая приводит мир в движение, но о том, какая именно это сила, зритель может лишь догадываться.

Картины авторства Эндрю Уайетта

(2) этапы

2.1

— Проверка доступности GPU через nvidia-smi — Установка библиотеки: bitsandbytes, transformers, diffusers, peft (параметрическая настройка, включая LoRA), скрипт для обучения Dreambooth-LoRA.

0

2.2

— Сбор датасета из изображений картин Эндрю Уайетта. Я использовала 50 штук размером 1:1 и загрузила в Google Collab в отдельную директорию.

big
Original size 679x201
Original size 1595x313

Превью загруженных в директорий Google Collab изображений

2.3

— К каждой подписи в названиях изображений, с помощью модели BLIP, добавляется префикс «painting in the style of WYATT». Пути к файлам и подписи сохраняю в metadata.jsonl.

Original size 1703x549

2.4

— Использование техники Dreambooth-LoRA для дообучения Stable Diffusion.

БАЗОВЫЕ МОДЕЛИ:

stabilityai/stable-diffusion-xl-base-1.0

VAE madebyollin/sdxl-vae-fp16-fix

ОСНОВНЫЕ ПАРАМЕТРЫ ОБУЧЕНИЯ:

Разрешение: 512×512 Batch size: 2 Learning rate: 1e-4 Количество шагов: 500 8-bit Adam (оптимизация памяти) FP16

— Запуск обучения через accelerate

Original size 771x529

(3) генерация изображений

После обучения использую конвейер DiffusionPipeline для генерации изображений по разным промтам. Настройки генерации: 25 шагов, FP16.

Полученные изображения:

промт картинки слева — «An old dilapidated house stands in a field, next to it are several trees» промт картинки справа — «A boy and a grandfather stand on the seashore and look into the distance»

промт картинки слева — «A girl with one dog is sitting on a hill, in the distance there is a forest» промт картинки справа — «An old man is leaning on a large tree and looking at the bright moon»

Original size 1024x1024

промт — «An old woman sits in the kitchen and thoughtfully looks out the window, there is an endless field outside the window, there is a jug on the kitchen table»

промт картинки слева — «portrait of a young lady, she is wearing a beige light dress, surrounded by forest, night, the moon» промт картинки справа — «portrait of a young guy sitting on the grass»

промт картинки слева — «a dark night, an empty living room, a table and four empty chairs around, stars are outside the window» промт картинки справа — «portrait of a young girl»

(4) итоги генерации

Генеративная модель хорошо справляется с воспроизводством изобразительного стиля выбранного мной художника.

блокнот с кодом

описание применения генеративной модели

В проекте была использована модель stable-diffusion-xl-base-1.0: https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0

Обучение генеративной нейросети под стиль художника Эндрю Уайетта
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more