Исходный размер 1140x1600

Обучение генеративной нейросети стилю обложек Black Metal альбомов 80-х

Проект принимает участие в конкурсе

Black metal в 80-х годах сформировал узнаваемый визуальный язык: монохромная и приглушённая палитра, высокий контраст, зернистая фактура, «сырой» свет, лесные и руинированные локации, ритуальная символика, corpse paint и подчёркнуто мрачная атмосфера

Задачей проекта было обучить Stable Diffusion XL так, чтобы модель воспроизводила этот стиль и генерировала обложки в единой эстетике Black metal.

Исходные изображения:

Для обучения был использован собранный датасет из 108 квадратных обложек альбомов 1980-х, отражающих ключевые черты black metal.

Обложки получены с: https://www.kaggle.com/datasets/ronanpickell/1980s-album-covers Действует лицензия CC0: Public Domain

big
Исходный размер 1858x1412

Серия изображений из датасета

Посредством обучения модели на датасете удалось достичь достойных результатов:

Модель смогла уловить характерную палитру. преобладание чёрного и светлого, глубокие тени, минимализм цвета.

Композиции выдержаны в духе жанра: центральные фигуры, лесные пейзажи, символика, атмосферные эффекты.

Переданы эффекты: зернистость, размытость, текстуры, характерные для олдскульных black metal-обложек.

Но стоит отметить, что модель генерирует чересчур реалистичные картинки по сравнению с абстрактными исходными. Более качественный результат можно получить, подав модели на обучение намного больше изображений.

Общая атмосфера — холод, мистика, изоляция, агрессия и эстетика жанра.

Код в ноутбуке:

Настройка

Превью датасета

Исходный размер 1145x639

BLIP

Исходный размер 1964x714

Установка требующихся зависимостей

Исходный размер 648x708

Обучение LoRA

Исходный размер 622x221

Сохранение модели на Hugging Face

Генерация обложек

Использовалась модель SDXL с LoRA-адаптером, негативный промт для уменьшения артефактов, фиксированные параметры генерации (30 шагов, guidance 7.0), контроль сидов для воспроизводимости.

Исходный размер 1392x1173

В ходе работы над проектом были задействованы: — Модель для дообучения — VAE энкодер

Обучение генеративной нейросети стилю обложек Black Metal альбомов 80-х
Проект создан 24.03.2026
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше