Цель проекта — адаптировать генеративную модель Stable Diffusion под мой индивидуальный визуальный стиль и проверить, насколько точно нейросеть способна воспроизводить устойчивые художественные признаки при ограниченном датасете. Проект решает две задачи одновременно: Обучение модели на специфический визуальный стиль (авторская стилистика иллюстраций); Проверка устойчивости генерации при изменении промптов и условий (разные сцены, композиции, объекты). В рамках работы создаётся персонализированная генеративная модель, способная генерировать изображения, визуально согласованные с исходным стилем, но не копирующая конкретные изображения из датасета.
исходные изображения для обучения
результат
Процесс обучения проводился в среде Kaggle с использованием GPU-ускорения.
В качестве метода дообучения был выбран подход LoRA (Low-Rank Adaptation). Данный метод позволяет адаптировать модель без полного переобучения, что существенно снижает вычислительные затраты. Обучение проводилось на базе модели Stable Diffusion v1.5 с использованием библиотеки Diffusers. В процессе обучения модель анализировала изображения и соответствующие им текстовые описания, выделяя характерные элементы стиля
В ходе проекта была успешно реализована задача дообучения генеративной модели под авторский стиль. Использование LoRA позволило добиться результата с минимальными вычислительными затратами. Полученные результаты демонстрируют, что даже при небольшом датасете возможно формирование узнаваемого визуального языка, что открывает перспективы для использования генеративных моделей в дизайне и цифровом искусстве.




