Референсы
Для обучения генеративной модели я решила взять женскую обувь, а точнее различные каблуки. Я занимаюсь дизайном и мне были интересно как нейромодель будет генерировать новые варианты обуви.
Для датасета я взяла изображения различных видов женской обуви. Все они приведены к размеру 1:1.
Сгенерированные изображения
При генерации одной пары каблуков генеративная модель справляется со значительным успехом.
При увеличении количества пар обуви, модель начинает вести себя нестабильно и путаться.
При этом важно отметить, что все изображения генеративная модель собрала в единой стилистике и цветовой гамме. В целом при одиночной генерации модель прекрасно справляется и невероятно четко генерирует пару каблуков.
Описание процесса обучения
В ходе обучения нейросети Stable Diffusion XL я использовала среду Гугл коллаб с серверным ускорителем Python 3 на базе GPU, чтобы ускорить процесс обучения и генераций.
В результате генеративная модель создала серию изображений по заданному промту. Нейромодель начала вести себя некорректно при увеличение детализации изображений и генерации стали нестабильными, сильно проседало качество, что в целом очевидно, так как ей не хватало исходных данных.
Описание применения генеративных моделей
Chat GPT использовался для написания промтов к финальной части генераций.




