MiniPixelDream на HSE Design

Концепция

Исходный размер 960x512

MiniPixelDream — это автоматизированный мини-проект по дообучению генеративной модели Stable Diffusion XL (SDXL) с использованием метода LoRA (Low-Rank Adaptation) для генерации pixel art изображений.

Основная идея: Создать легкую адаптацию модели (LoRA) для конкретного стиля (pixel art), позволяющая генерировать изображений в выбранном стиле без необходимости полного переобучения SDXL.

Примеры изображений из датасета

Исходный размер 960x512

Примеры изображений из датасета

Принцип работы

Исходный размер 557x370

Примеры изображений из датасета

Процесс обучения:

-Разархивирование датасета и подготовка выборки. -Генерация метаданных и BLIP captions для каждого изображения. -Запуск тренировки LoRA -Генерация изображений по промпту

Результирующая серия изображений

После обучения LoRA и генерации по сценам получена серия изображений:

Исходный размер 557x370

Результат генерации

Все сцены выполнены в едином стиле pixel art, с характерной пиксельной графикой, яркими цветами и минималистичной детализацией, что сохраняет визуальную целостность проекта.

Исходный размер 1024x1024

prompt = «pixelartstyle stylized pixel art illustration, limited color palette, blocky shading, retro game look, snowing meadow with black flowers and white flowers, melancholic atmosphere» # @param

Исходный размер 1024x1024

prompt = «pixelartstyle stylized pixel art illustration, industrial spaceport on a vast desert planet, ships taking off» # @param

Ещё результаты

Итоговые изображения полностью соответствуют цели проекта — унифицированный стиль при разнообразных сюжетах, что демонстрирует способность LoRA адаптировать SDXL к конкретной стилистике.

Использование Generative AI

Помимо обученной LoRA-модели для генерации изображений, в проекте использовались нейросети для вспомогательных задач:

BLIP (Salesforce/blip-image-captioning-base) Генерация описаний (captions) для исходных изображений, улучшение качества prompt’ов. ChatGPT / GPT-помощник (опционально) Формирование описания проекта, идей, комментариев к визуальным результатам.

Исходный размер 1024x1024

Ещё один результат

Ноутбук