Original size 1140x1600

Обучение генеративной модели на творчестве Г. Р. Гигера

PROTECT STATUS: not protected

Концепция

Целью проекта было обучение нейросети, способной понимать и воспроизводить художественные стили знаменитых художников. Нейросеть учится на подготовленном наборе данных, состоящем из картин художника, анализирует уникальный творческий стиль и пытается его воссоздать.

В данном проекте в качестве основы для обучения нейросети я выбрала работы швейцарского художника, знаменитого своими мрачными сюжетами и с узнаваемым в поп-культуре стилем — Ганса Рудольфа Гигера.

Мне показалось интересным для данного проекта взять именно творчество Гигера из-за объединения механического и человеческого (биомеханики) на его картинах, в чем можно провести интересную параллель с искусственным интеллектом.

Датасет

big
Original size 0x0

«Полтргейст», Ганс Рудольф Гигер, 1985

Для датасета были собраны картины Гигера, с главным фокусом на типичные для художника изображения антропоморфных существ и существ с механическими частями тел.

big
Original size 2163x797

«Полтргейст — Примитивное создание», Ганс Рудольф Гигер, 1985

big
Original size 2480x1266

«Кармен», Ганс Рудольф Гигер, 1989

Все работы Гигера были обрезаны в соотношение 512Х512 в качестве подготовки изображений для обучения нейросети.

Original size 2480x799

«Набережная в дыму», Ганс Рудольф Гигер, 1985

Процесс обучения

Инструменты:

1. Google collab — написание кода

2. Stable diffusion — генеративная модель для обучения

3. Hugging face — получение токена

Original size 1241x864

Часть кода по обучении нейросети — скрин экрана

Первым шагом работы была установка библиотек. Далее был загружен подготовленный вручную датасет из картин Гигера.

Original size 1237x620

Часть кода по обучении нейросети — скрин экрана

Важной частью для работы нейросети и ее понимания была генерация промптов к загруженным изображениям.

Original size 700x294

Код для обучения модели и генерации изображений — скрин экрана

Полноценный код можно увидеть по ссылке предоставленной ниже, а сама модель доступна на Hugging Face.

Ссылка на блокнот с кодом

Модель на Hugging Face

Применение модели

1. «moscow, russia»; 2. «times square, new york»

Нейросеть очень удачно и четко передает стиль Гигера, но не передает промпты, далекие от типичного творчества художника. Так, в экспериментальных запросах с локациями в промпте, результат ярко отображает стиль Гигера, но не указанный промпт.

1. «a castle»; 2. «skyscraper»

Original size 1024x1024

«blue skeleton floating»

Нейросеть отлично справляется с мрачными сюжетами, скелетами и монстрами.

1. «an animalistic giant burning»; 2. «monstrous animal on a hill»

Нейросеть изображает очень ярких монструозных существ, четко отображающих в своей сути стиль Гигера.

Original size 1024x1024

«three monsters fighting»

Original size 1024x1024

«a fluffy sheep»

Также меня интересовало попробовать нетипичный сюжет в стиле Гигера. Изображение с промптом «a fluffy sheep» удачно сохранила в себе мрачность работ Гигера и интересную текстуру на шерсти, при этом четко отобразила животное.

Original size 1024x1024

«a human»

В случае с запросом изобразить людей, модель автоматически отображает биомеханических людей, лишь с отдаленной человеко-подобностью, но типичной творчеству Гигера.

Original size 1024x1024

«a machine»

Изображение с простым промптом «machine» («машина») не так сильно отличается от «человека», изображенного в стиле Гигера.

0

1. «a portrait of a lady»; 2. «a self-portrait by artificial intelligence»

Интересно, что первое получившееся наиболее человечное изображение получилось с промптом «a self-portrait by artificial intelligence». Также, упоминание «lady» благодаря подобранным изначально изображением выдает человечные лица и фигуры, в отличие от просто «human».

0

1. «first out of seven stages of a human transforming into a machine»; 2. «last out of seven stages of a human transforming into a machine»

Нейросеть очень четко передает свойственную Гигеру «биомеханическую» живопись, т. е. сочетает человеческие черты с элементами механики, создавая кошмарные образы.

Original size 1024x1024

«forth out of seven stages of a human transforming into a machine»

Вывод

Работа нейросети полностью зависит от ее основы, которой является человеческое творчество. Она быстро анализирует и создает новые работы, которые копируют детали заложенного в ее основу и собирают из таких деталей изображение из промпта.

Нейросеть может быть интересным инструментом для экспериментов с изображением или использована как референс для вдохновения, основа для нового творчества.

При этом, нейросеть остается инструментом и не может работать без основы, созданной ранее человеком.

Ссылки

Источник изображений: Ганс Рудольф Гигер — работы // Артхив URL: https://artchive.ru/hansruedigiger/works

Обучение генеративной модели на творчестве Г. Р. Гигера
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more