Original size 2480x3500

Обучение генеративной нейросети

PROTECT STATUS: not protected
14

Идея проекта заключается в том, чтобы обучить нейросеть создавать картины в стиле художника Ивана Айвазовского и создать серию картин о том как бы выглядели порты современных городов.

Исходные изображения

big
Original size 2560x1856

Иван Айвазовский / «Ревель (Таллин)» / 1845

big
Original size 1702x1200

Иван Айвазовский / «Вид Венеции со стороны Лидо» / 1855

big
Original size 1887x1200

Иван Айвазовский / «Закат на море» / 1848

Original size 1701x1200

Иван Айвазовский / «Море. Коктебель» / 1853

Получившаяся серия изображений

Original size 1024x1024

Промпт: antarctica

Original size 1024x1024

Промпт: istanbul strait on a sunny day

Original size 1024x1024

Промпт: mumbai port

Original size 1024x1024

Промпт: peter and paul fortress, saint petersburg

Original size 1024x1024

Промпт: port of dubai port in night

Original size 1024x1024

Промпт: port of new york

Original size 1024x1024

Промпт: shanghai port in calm sunny weather

Original size 1024x1024

Промпт: singapore port on a moonlit night

Original size 1024x1024

Промпт: storm in the port of tokyo

Original size 1024x1024

Промпт: view of porto, portugal

Итоговая серия представляет собой порты современных городов. Изображения портов представлены в различных погодных и временных условиях. Стиль оригинальных картин Ивана Айвазовского хорошо получилось передать при обучении нейросети. Лучше всего вышло передать морскую атмосферу и строение кораблей. Отдельно стоит отметить, как нейросеть смогла изобразить побережье Антарктики, несмотря на то, что Айвазовский редко писал зимние сюжеты. Первоначальная идея попробовать сгенерировать различные порты удалась, хотя внешний вид кораблей остались из XIX века.

Ноутбук с кодом: https://disk.yandex.ru/d/NXyktCT47AVzHg

Процесс обучения:

Сначала скачиваем все картины Айвазовского с сайта Википедия. Названия файлов собираем в отдельный список.

Original size 1227x584
Original size 1123x495

Потом создаем отдельную папку, куда сохраняются обрезанные картины. Циклом проходимся по всем файлам, обрезаем их и записываем в новую папку.

Original size 1253x681

Скачиваем нужные библиотеки. Код взят из репозитория преподавателя.

Original size 1239x441

Загружаем BLIP для автоматического добавления подписей к картинам Айвазовского.

Original size 1227x590

Подписываем каждую картину с помощью цикла и удаляем BLIP из памяти.

Original size 1248x465

Заходим в аккаунт Hugging Face с помощью токена доступа, запускаем ускоритель и скачиваем ещё одну библиотеку.

Original size 1237x418

Запускаем обучение модели со 1000 шагами обучения и контрольными точками каждые 500 шагов. После этого сохраняем модель.

Original size 1235x550
Original size 1256x651
Original size 1240x369

Создаем функцию для генерации и вывода изображения на основе промпта. Сохраняем полученные изображения в папку RESULT.

Original size 1235x688

Описание применения генеративной модели:

BLIP (https://github.com/salesforce/BLIP) использовалась для добавления описания к картинам Айвазовского. Stable Diffusion (https://github.com/Stability-AI/generative-models) использовалась для дообучения на картинах Айвазовского с целью дальнейшей генерации изображений.

Обучение генеративной нейросети
14
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more