Концепция проекта
Создание уникального визуального мира рыб, следующих по шоссе, с целью совместить противодействующие визуальные элементы — животных, движимых природой и инстинктом со строгой, неестественной инфраструктурой.
Исходные изображения для обучения
Источники и права использования: — Фотографии городских и межконтинентальных шоссе -Фотографии разных рыб Фотографии были собраны из различных фотостоков с тэгом «royalty-free»


Финальная серия изображений
Анализ соответствия концепции
Лучшие работы проекта успешно передают задуманное изображение, совмещая свободное передвижение рыб в их родном пространстве с городским пейзажем. Достигнута направленность рыб вдоль дороги, в соответствии с задумкой.
Техническая реализация
Параметры и методы обученной модели: — Базовая модель: Stable Diffusion XL 1.0 — Метод адаптации: Dreambooth с LoRA — Размер датасета: 25 изображений — Количество шагов: 100 — Разрешение: 512×512 пикселей
Обучение модели проводилось на аккуратном датасете, содержащем сравнимое количество изображений морской фауны и разных форматов дорог. Для улучшения качества результатов использовалась техника gradient checkpointing и 8-битная оптимизация.
Примененные библиотеки
Stable Diffusion XL 1.0 — Ссылка: https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0 BLIP (Bootstrapping Language-Image Pre-training) — Ссылка: https://huggingface.co/Salesforce/blip-image-captioning-base Dreambooth + LoRA методик




