Запретное воскрешение Дюрера: обучение генеративной нейросетевой модели на HSE Design

Исходный размер 4000x2860

«Судариум, поддерживаемый двумя ангелами» — 1513, Альбрехт Дюрер.

Концепция проекта

Целью проекта являлось обучить генеративную нейросетевую модель для создания изображений в стиле линейных гравюр в стиле Альбрехта Дюрера.

Его стиль представляет лично для меня большой интерес, так как Дюрер является одним их моих любимых творцов. А также, подобный стиль слабо распространен в современном мире как среди художников, так и среди генеративного ИИ.

И, исходя из моего опыта, даже с прикрепленным референсом стиля базовые доступные генеративные модели слабо справляются с воплощением подобного стиля.

Исходный размер 2550x4000

«Апостол Павел» — 1514, Альбрехт Дюрер.

Исходные изображения

Для создания датасета использовано 45 гравюр художника, находящихся либо в публичном достоянии, либо имеющих лицензию CC0.

Изображения и информация о лицензиях взяты с: https://en.wikipedia.org/wiki/List_of_engravings_by_Albrecht_Dürer# (дата обращения: 21.02.2026); Ссылка на полный датасет: https://drive.google.com/file/d/1mnnzglj-zkTLvod_Uea4vNQRMtVo1tFa/view?usp=sharing

«Морской монстр» — 1496-1500, «Пейзаж с пушкой» — 1518, «Святой Евстафий» — 1499-1503, Альбрехт Дюрер.

Процесс обучения

Для обучения модели использовался исходный код из лекций нашего курса с внесением небольшого количества изменений.

Код

Ссылка на ноутбук: https://colab.research.google.com/drive/1Q9dkhKu2QmZHZbciRvGH2HWgbhZTPUBG?usp=sharing

Первоначальное обучение

Изначально модель обучалось по следующим настройкам, что привело к неудовлетворительным результатам:

Исходный размер 855x568

Результат напоминал скорее хаотичную комплекцию элементов из датасета, создающую визуальные паттерны, чем желаемые осмысленные изображения.

Исходный размер 1024x1024

Пример неудовлетворительной генерации по промту «рыцарь».

Внесение изменений

Для исправления были изменены настройки и проведено переобучение модели. Это с одной стороны привело к значительному улучшению качества результатов как в передаче стиля, так и в осмысленности итоговых изображений.

Исходный размер 864x566

Но с другой стороны, привело к большим затратам времени и доступных ресурсов сервиса google collab, из-за чего итоговых качественных изображений не так много.

Итоговый результат

Генерации по промту «engraving in Durer style, hell».

После дообучения модель стала выдавать куда более удовлетворяющий результат.

В данных генерациях уже хорошо отражается стиль штриха художника, детализация, наличие внимания к анатомическим деталям.

Однако идейная целостность отдельно взятых персонажей слаба. Модели слабо удаются генерации обширных понятий и большого количества персонажей.

Генерации по промту «engraving in Durer style, smiling jester».

Генерация отдельного персонажа дается в некоторой степени лучше.

В таком случае хорошо отражается качество работы с тканью, складками тенями и детальным штрихом. Также модель неплохо справляется с созданием лиц в стиле художника.

Однако все еще заметны типичные для ИИ артефакты и проблемы с анатомией.

При этом степень этих проблем может сильно разнится между генерациями. Так, первая итерация шута — бесформенная масса ткани с лицом и одной скрюченной конечностью. А последняя имеет уже ярко выраженный торс и в некотором излишнем количестве руки.

Исходный размер 1024x1024

Генерация по промту «engraving in Durer style, pig with piglets».

С генерациями животных модель справляется заметно лучше, чем с человекоподобными персонажами.

Артефакты менее значительны, анатомия животных практически полностью верна. Также отражен скурпулезный подход к анатомии зверей в гравюрах Дюрера.

Генерации по промту «engraving in Durer style, castle on hill».

Генерируемые пейзажи имеют куда лучший вид, чем персонажи. Они все также детализированы, но из-за масштаба артефакты не так бросаются в глаза.

Кроме того, на пейзажах заметен один из приемов художника — характерные горизонтальные штрихи для создания неба и облаков.

Генерации по промту «engraving in Durer style, skull».

Лучший результат обученная модель показывает при генерации отдельных объектов.

Получается наиболее чистый по целостности и количеству артефактов результат.

Кроме того, в таком случае получается еще более высокий уровень деталей и штрихов, что характерно для части гравюр художника, преимущественно изображающих интерьеры или как раз-таки отдельные объекты или их компоновки.

Дополнительное сравнение модели

Для дополнительного сравнения были проведены генерации в модели «nano babana» 2.0.

Для генерации были прикреплены соответствующие референсы по стилю.

При одинаковых промтах модель «nano babana» создавала либо хоть и более чистое, но отдаленное по стилю изображение, либо брала элементы напрямую из референсов (вплоть до полного изображения) и лишь немного видоизменяла.

Результаты по промту «castle on hill in Durer style»

В дополнении, сервисы анализа изображения и поиска по исходному изображению, определяют получившиеся результаты генерации как работы Дюрера.

Результаты поиска по изображению через «яндекс».

Итог

Получившаяся натренированная модель отлично передает стиль линейных гравюр Альбрехта Дюрера.

Модель хорошо подходит для отрисовки объектов или зверей, при нескольких генерациях. Однако требует большого количества попыток для создания людей или человекоподобных персонажей.

Использование ИИ

Помимо обученной нейросетевой модели в проекте использовался DeepSeek для анализа и исправления ошибок в коде программы. А также для уточнения насчет возможности использования картин, находящихся в публичном достоянии.

Ссылка на использованную модель: https://deepseek.com/en/