Реконструкция художественного стиля Амедео Модильяни с помощью Stable Diffusion XL
Цель проекта — обучить генеративную нейросеть воспроизводить художественный стиль Амедео Модильяни и использовать её для генерации новых изображений, сохраняющих ключевые особенности его живописного языка.
В основе проекта лежит идея переноса художественного стиля через дообучение модели Stable Diffusion XL с использованием метода LoRA. В отличие от генерации «из коробки», такой подход позволяет зафиксировать специфические визуальные признаки автора и добиться большей стилистической согласованности.
Стиль Модильяни был выбран не случайно. Он легко узнаваем за счёт: ▪ вытянутых пропорций лица ▪ удлинённых шей ▪ характерных миндалевидных глаз ▪ приглушённой, «пыльной» цветовой палитры
Проект направлен на проверку гипотезы: может ли нейросеть не просто копировать изображения, а воспроизводить художественную систему и внутреннюю логику стиля.
Критерии отбора изображений: ▪ наличие характерных стилистических признаков ▪ отсутствие сильных искажений и артефактов ▪ достаточное разрешение ▪ единая жанровая направленность (портреты)
Перед обучением все изображения были автоматически приведены к единому формату: ▪ квадратное соотношение сторон (1:1) ▪ масштабирование до 512×512 ▪ центрирование композиции
Это позволило минимизировать шум в данных и сосредоточить модель на изучении именно стилистических признаков, а не случайных особенностей изображений.
В дальнейшем поиске примера других картин помогал ChatGPT
примеры картин для обучения
Развёрнутый анализ результатов
результат
Полученные изображения демонстрируют, что модель успешно усвоила ключевые характеристики стиля.
Передача стилистических признаков
Наиболее устойчиво воспроизводятся: ▪ вытянутые пропорции лица ▪ удлинённая шея ▪ упрощённая анатомия ▪ миндалевидная форма глаз ▪ мягкая, приглушённая цветовая гамма
Особенно хорошо модель справляется с общей геометрией лица и композиционной простотой, характерной для работ Модильяни.
Соответствие исходной идее
Изначальная идея проекта заключалась в переносе художественного языка, а не копировании конкретных работ.
Результаты показывают, что: ▪ изображения не являются прямыми копиями ▪ сохраняется общая стилистика ▪ формируется ощущение «новых работ в духе автора»
Это говорит о том, что модель усвоила не только визуальные паттерны, но и базовые принципы стилизации.
Процесс обучения
Обучение проводилось в среде Google Colab с использованием готового ноутбука на базе библиотеки Diffusers.
Основные этапы: ▪ подготовка датасета (очистка, приведение к формату) ▪ настройка параметров обучения ▪ запуск обучения через DreamBooth + LoRA ▪ сохранение весов модели ▪ генерация изображений
Ключевые параметры: ▪ модель: SDXL ▪ разрешение: 512×512 ▪ шаги обучения: ~200 ▪ batch size: 1 ▪ mixed precision (fp16)
Использование LoRA позволило: ▪ снизить требования к ресурсам ▪ ускорить обучение ▪ сохранить базовые знания модели
В проекте использовались следующие модели и инструменты:
▪ Stable Diffusion XL — для генерации изображений ▪ LoRA (Low-Rank Adaptation) — для дообучения ▪ ChatGPT — для: ▪ формулировки идеи проекта ▪ написания текстового описания ▪ структурирования лонгрида
Цель использования ИИ: ▪ ускорение работы с текстом ▪ помощь в формулировке аналитических выводов ▪ улучшение качества презентации проекта
ИИ использовался как инструмент, а не как источник готового решения.
Вывод
Проект показал, что генеративные модели способны достаточно точно воспроизводить художественные стили при ограниченном датасете.
Удалось добиться: ▪ высокой стилистической консистентности ▪ узнаваемых признаков автора ▪ вариативности внутри одного стиля
Это подтверждает потенциал использования диффузионных моделей в области цифрового искусства, стилизации и визуального дизайна.
В проекте использовались изображения из открытых источников с допустимым использованием, включая материалы с лицензиями Creative Commons.
