Original size 1140x1600

Обучение генеративной нейросети под стиль «Марина» работ И. К. Айвазовкского

PROTECT STATUS: not protected
9

Концепция

Цель проекта — дообучение нейросети Stable Diffusion и генерация серии изображений в стиле живописного направления «Марина», а конкретнее — на основе работ И. К. Айвазовского. В результате должны получиться морские композиции с похожей манерой исполнения и полупрозрачной цветовой гаммой.

Исходные изображения — датасет из 98 работ художника, морские пейзажи разных настроений и композиционного строения.

big

И. К. Айвазовский, «Солнечный день», 1884 г.

big

И. К. Айвазовский, «Буря», 1886 г.

big

И. К. Айвазовский, «Радуга», 1873 г.

И. К. Айвазовский, «Этюд воздуха над морем», 1835 г.

Стартовый архив

Первый архив картин состоит из элементов разного размера и расположения.

Original size 3500x2000

Оригинальные картины И. К. Айвазовского.

Для приведения всех изображений в один формат 512×512 пикс. был написан дополнительный код. Для избегания лимита операций Google collab код воспроизведен в отдельной среде.

Принцип работы кода строится по алгоритму: 1. Импорт библиотек 2. Определение путей для Input и Output 3. Обрезка по центру квадрата (через функцию crop_center_square (img)) 4. Обработка изображений: - Проверка расширения файла (работаем только с .jpg, .jpeg, .png). - Открытие изображение и преобразование в формат RGB. -Автоматическая коррекция ориентации изображения на основе данных EXIF (если они присутствуют), чтобы устранить возможные проблемы с ориентацией (например, когда фото сделано вертикально). - Изменение размера изображения до 512×512 пикселей с использованием метода LANCZOS (качественное уменьшение). - Сохранение в папку Output

Original size 5118x1018

Картины И. К. Айвазовского после обработки.

Итоговая серия изображений

После обучения нейросеть сгенерировала несколько изображений по промптам: от короткого, простого предложения до сложного, детального запроса с описанием цвета, настроения и абстрактного погодного ощущения в пейзаже.

Все изображения созданы на основе изначального формата, 512×512.

Original size 1024x1024

«Aiwasowski style, light blue sea and 2 ships».

Original size 1024x1024

«Aiwasowski style, dark blue sea and 1 ship».

Экспериментальные промпты о штормовом море отличаются только парой слов — временем суток и силой непогоды. Вот почему результаты получились схожие:

Original size 3717x1234

Промпты: «Aiwasowski style, strong storm in the sea», «Aiwasowski style, strong storm in the night sea», «Aiwasowski style, night. Catastrophic storm in the dark blue sea sea».

Original size 1024x1024

Еще более краткий промпт: «Aiwasowski style, night. Catastrophy in the sea».

Далее — более детальные, сюжетные промпты по типу «Утро. Одинокий корабль далеко в море.»

Original size 1024x1024

«Aiwasowski style, morning. The lonely ship far away in the sea».

Промпт: «Романтичный вечер. Корабль уходит тихую ночь.». Для тишины и романтики нейросеть добавила сиреневые и розовые оттенки.

Original size 1024x1024

«Aiwasowski style, romantic evening. The ship is running out in the quiet night».

Более сложный результат на развернутый запрос: «Огни в море теплы, небо наполнено глубокими синими цветами. Корабль уплывает в тихую темноту.»

Original size 1024x1024

«Aiwasowski style, romantic evening. Lights in the sea are warm, the sky is in deep blue colors. The ship is running out in the quiet dark».

Промпт про утро с указанием цветов:

Original size 1024x1024

«Aiwasowski style, quiet morning. The ships are living the port in yellowish and bluish semi-transparent colors».

Развернутые запросы с описаниями облаков и их состояния, некоторых дополнительных деталей пейзажа:

Original size 1024x1024

«Aiwasowski style, late morning. The sea is slightly storming, all the sheaps are beside the coast».

Original size 1024x1024

«Aiwasowski style, dark night. The sea is storming heavily, lightnings break in the water, dark black clouds are hanging over the ground».

Original size 1024x1024

Результат 13.

В итоге, в серии наблюдается схожая тенденция: изображения генерируются по аналогичному композиционному плану. Большая часть облаков и волн (форма волны) похожи, а корабли следуют одной перспективе, наклону и оформлению конструкции.

Различия проявляются в цветовой гамме и контрастности — в зависимости от запроса изображение содержит либо вариацию одного цвета, либо плавный/резкий микс из нескольких.

Среда выполнения

Код написан в Google Collab и сохранен в формате IPYNB, для обучения использована модель Stable Diffusion. Изображения в стартовом датасете взяты из публичных архивов творчества И. К. Айвазовского.

Пояснительные комментарии к процессу обучения добавлены в исходном коде. Ссылка на файл: https://drive.google.com/file/d/1JAlg3ZzLRwD3S-WgZovwThuAjmLwKkpg/view?usp=sharing

Дополнительные источники

В качестве вспомогательного инструмента использован Chat GPT-4o. Он объяснил некоторые куски кода и их функции, а также перевел часть пояснительных комментариев на русский язык.

Обучение генеративной нейросети под стиль «Марина» работ И. К. Айвазовкского
9
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more