описание идеи всего проекта
Концепция проекта
Проект посвящен созданию нейросетевой модели, способной генерировать изображения в стиле Укиё-э (японская гравюра на дереве) с использованием технологий DreamBooth и LoRA для тонкой настройки Stable Diffusion XL (SDXL).

Актуальность
Укиё-э — уникальное направление японского искусства, получившее мировое признание благодаря работам таких мастеров, как Кацусика Хокусай («Большая волна в Канагаве») и Утагава Хиросигэ («53 станции Токайдо»).
Цель проекта
Обучить нейросеть генерировать изображения в стиле Укиё-э на основе 46 исходных изображений, используя метод DreamBooth с LoRA для экономии ресурсов и сохранения качества.
исходные изображения для обучения

Характеристика датасета Количество изображений: 46 Источник: Собраны из открытых источников
Содержание: Традиционные японские гравюры, включающие: Природные пейзажи (гора Фудзи, волны, сакура) Портреты (гейши, самураи, актеры кабуки) Мифологические существа (драконы, кицунэ) Архитектурные элементы (храмы, пагоды)

Содержание: Традиционные японские гравюры, включающие: Природные пейзажи (гора Фудзи, волны, сакура) Портреты (гейши, самураи, актеры кабуки) Мифологические существа (драконы, кицунэ) Архитектурные элементы (храмы, пагоды)
Исходные изображения: 46 изображений в формате JPG Разрешение: 1024×1024, 1:1
результирующая серия изображений
Сгенерированная серия (12+ изображений) Серия включает следующие темы:
1 Гора Фудзи и волны ukiyoe style, Mount Fuji with cherry blossoms and waves, Hokusai inspired 2 Гейша в саду ukiyoe style, geisha in colorful kimono walking in garden with umbrella 3 Самурай на закате ukiyoe style, samurai warrior at sunset with mountains and clouds 4 Японский дракон ukiyoe style, Japanese dragon flying over ocean waves, dramatic sky 5 Храм с сакурой ukiyoe style, traditional Japanese temple with pagoda and cherry blossoms 6 Карпы кои ukiyoe style, koi fish swimming in pond with water lilies 7 Осенний пейзаж ukiyoe style, autumn landscape with red maple leaves and bridge 8 Зимняя гора ukiyoe style, snow-covered mountain with pine trees 9 Бамбуковый лес ukiyoe style, bamboo forest with sunlight filtering through 10 Актер кабуки ukiyoe style, kabuki actor in elaborate costume 11 Лис-кицунэ ukiyoe style, fox spirit kitsune in magical forest 12 Журавли ukiyoe style, crane birds flying over mountains












развернутый комментарий к серии
Визуальный анализ и стилевые характеристики

Удалось передать следующие элементы стиля Укиё-э: Элемент стиля: Как проявился в сгенерированных изображениях Плоскостность: Отсутствие глубокой перспективы, фигуры расположены на нескольких планах Декоративность: Насыщенные цвета, орнаментальные узоры на кимоно и архитектуре Линейный контур: Четкие черные контуры, характерные для ксилографии Волны и вода: Стилизованные волны, узнаваемые по работам Хокусая Цветовая гамма: Преобладание синего, зеленого, красного и золотого Композиция: Асимметричные композиции, диагональные линии
Разнообразие композиций: Изображения 1, 2, 3: крупный план (фигуры, волны) Изображения 4, 5: средний план (храмы, драконы) Изображения 6, 7, 8: дальний план (пейзажи)
Цветовые вариации: Весенние тона: розовый, салатовый (изобр. 1, 5) Осенние тона: красный, оранжевый (изобр. 7) Зимние тона: белый, синий (изобр. 8)
Динамика: Статичные сцены: храмы, пейзажи Динамичные сцены: дракон, волны, летящие журавли
соответствие первоначальной идее
Что удалось

Узнаваемый стиль Укиё-э (волны, контуры, цветовая гамма) Разнообразие тем (природа, люди, мифология) Высокое качество генерации
ноутбук с кодом и описание процесса обучения
Архитектура проекта Проект структурирован в 18 основных этапов:
- Установка библиотек
- Проверка GPU
- Создание папки для датасета
- Загрузка изображений
- Предпросмотр изображений
- Загрузка BLIP для подписей
- Создание промптов в стиле Укиё-э
- Генерация подписей через BLIP
- Создание JSONL файла
- Загрузка JSONL на GitHub
- Очистка памяти
- Загрузка скрипта обучения
- Параметры обучения
- Запуск обучения (500 шагов, ~50 минут)
- Сохранение модели на Google Drive
- Сохранение информации о модели
- Генерация 12+ изображений
- Отображение результатов
Этапы обучения Этап 1: Подготовка данных Загружено 46 изображений BLIP сгенерировал подписи Добавлен префикс «ukiyoe style, traditional Japanese woodblock print, " Создан JSONL файл metadata.jsonl
Этап 2: Загрузка модели SDXL base model (6.94 GB) VAE для экономии памяти LoRA адаптер
Этап 3: Обучение
bash
accelerate launch train_dreambooth_lora_sdxl.py
--pretrained_model_name_or_path="stabilityai/stable-diffusion-xl-base-1.0»
--dataset_name="ukiyoe_style»
--output_dir="ukiyoe_style_lora»
--resolution=1024
--train_batch_size=1
--gradient_accumulation_steps=4
--max_train_steps=500
--use_8bit_adam
--mixed_precision="fp16»
Результаты обучения: Шаг 250: loss = 0.231 Шаг 500: loss = 0.193 Время: ~50 минут на T4 GPU
Роль GenAI в проекте: BLIP — создал 46 текстовых описаний, которые использовались для обучения модели SDXL + LoRA — основная генеративная модель, обученная на датасете ChatGPT — помог структурировать документацию и описать результаты GitHub Copilot — ускорил написание кода, предложил оптимизации
результаты и выводы
Достигнутые результаты
Результат Количество обученных изображений 46 Количество сгенерированных изображений 12 Время обучения ~50 минут Размер LoRA модели ~50 MB Качество генерации 1024×1024
Что получилось Модель научилась генерировать узнаваемый стиль Укиё-э Сохранены характерные элементы: волны, контуры, цветовая гамма Разнообразные темы: природа, портреты, мифология Высокое качество детализации

Вывод Я реализовала задачу обучения модели Stable Diffusion XL на стиль Укиё-э с использованием DreamBooth и LoRA. Полученная модель способна генерировать высококачественные изображения в традиционном японском стиле по текстовым промптам. Созданная серия из 12 изображений демонстрирует разнообразие тем и высокое качество передачи стилистических особенностей японской гравюры.




