Исходный размер 1140x1600

Обучение генеративной нейросети под свой стиль

Проект принимает участие в конкурсе

Идея проекта

post

Идея проекта заключается в исследовании возможностей генеративных моделей для создания fashion-объектов в наивной детской стилистике. Основной концепт — совмещение двух противоположных визуальных языков: примитивного, «детского» рисунка и более сложной структуры дизайнерской одежды. (исходное изображение)

исходные изображения

post

В качестве исходных данных был использован набор изображений (датасет), включающий рисунки, выполненные в детской манере: с упрощёнными формами, яркими цветами, неровными линиями и отсутствием реалистичной проработки. Все изображения были предварительно обработаны: — приведены к единому формату (512×512 пикселей) — очищены от лишних деталей, не соответствующих стилю — отобраны по принципу визуального сходства

Данный датасет позволил задать модели чёткое представление о целевом стиле генерации. (исходное изображение)

Результирующая серия изображений

post

В результате обучения была получена серия изображений, представляющая собой коллекцию платьев, выполненных в детской наивной стилистике.

Каждое изображение отражает вариации одного и того же визуального языка, но отличается по: — форме (объём, силуэт, пропорции) — декоративным элементам (узоры, символы, линии) — цветовым решениям

Серия воспринимается как единая коллекция, объединённая общей эстетикой.

Результирующая серия изображений

Развёрнутый комментарий и анализ результатов

post

Результаты в целом соответствуют первоначальной концепции проекта: изображения выглядят как дизайнерские эскизы, выполненные ребёнком, но при этом сохраняют читаемость формы одежды.

С точки зрения генерации, важную роль сыграли текстовые промпты, которые задавали направление (например, указание на «childlike drawing», «crayon texture», «naive style»). Дополнительные методы улучшения не использовались — упор был сделан на базовое обучение модели и подбор формулировок. (Результирующая серия изображений)

Модели удалось успешно передать ключевые элементы стиля: - неровные, «живые» линии - плоские цветовые заливки - намеренно упрощённые пропорции - эффект рисования мелками или маркерами

Результирующая серия изображений

Нейросеть обработала исходные данные, выделив наиболее устойчивые признаки стиля и начав комбинировать их в новых вариациях. При этом наблюдаются различия между изображениями: — в одних сильнее выражена декоративность — в других — акцент на форме силуэта — варьируется степень «хаотичности» линий

Ноутбук с кодом и описание процесса обучения

Обучение модели проводилось в среде Google Colab. В качестве базовой архитектуры использовалась Stable Diffusion.

Процесс включал следующие этапы:

  1. Установка необходимых библиотек
  2. Подключение Google Drive и загрузка датасета
  3. Загрузка предобученной модели
  4. Подготовка изображений (ресайз и нормализация)
  5. Настройка параметров обучения (LoRA)
  6. Запуск обучения в несколько эпох
  7. Генерация итоговых изображений с помощью текстовых промптов

Обучение происходило на GPU, что позволило ускорить процесс. Количество эпох было ограничено для предотвращения переобучения.

Код был проверен Google Gemini

Обучение генеративной нейросети под свой стиль
Проект создан 22.03.2026
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше