Исходный размер 1240x1750

Обучение генеративной нейросети под авторский стиль

Проект принимает участие в конкурсе

Идея проекта

Исходные изображения для обучения

Я решила обучить нейросеть на собственный художественный стиль, чтобы увидеть, какие черты окажутся наиболее выразительными и сохранятся в итоговых генерациях.

В датасет попало 17 рисунков, в основном портретов.

Исходные изображения для обучения

Результирующая серия изображений

a woman with long blonde hair and a sword/ anime drawing, a woman with long blonde hair and a sword

Исходный размер 1024x1024

eichi_v style, one cute white rabbit, sitting on a crescent moon

Для начала я сгенерировала несколько изображений с LoRA на максимальной интенсивности. Хотя черты стиля были узнаваемы, на генерациях присутствовало много артефактов и непонятных деталей.

lora_scale=0.5/lora_scale=0.75. «eichi_v style, one cute white rabbit, sitting on a crescent moon»

изображение из исходного датасета/"eichi_v style, anime drawing, side profile of a man with flowing black hair, gold accents», lora_scale = 0.75

Чтобы добиться лучших результатов, я протестировала разные значения lora_scale и изменения в промптах, добавив «simple anime drawing», так как стандартный SDXL склоняется к фотореализму. Лучше всего показали себя дополненные промпты и lora_scale 0,85. В этих генерациях стиль узнается, при этом артефактов значительно меньше, а лица проработаны точнее.

Исходный размер 1024x1024

«eichi_v style, anime drawing, side profile of a man with flowing black hair, gold accents», lora_scale = 0.85

Исходный размер 1024x1024

«eichi_v style, simple anime drawing, a woman with long blonde hair and a sword», lora_scale = 0.85

Небольшие артефакты всё же остались, но, думаю, это можно было бы исправить более длительным обучением и дополнительным файнтюнингом под простые аниме-иллюстрации.

simple anime drawing, a gir with pink hair, wearing sunglasses and smoking a cigarette/simple anime drawing, a man with pink hair, wearing sunglasses and smoking a cigarette

Процесс обучения

Перед началом обучения я обрезала все изображения под формат 1024×1024 с помощью сайта birme.net.

Исходный размер 1806x560

Превью датасета

Исходный размер 1829x451

Генерация подписей

После загрузки датасета в Colab были сгенерированы подписи. Обучение на 500 эпох заняло 40 минут.

Исходный размер 1839x456

Обучение

Исходный размер 1830x643

Генерация изображения

Обучение генеративной нейросети под авторский стиль
Проект создан 24.03.2026
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше