Noir style byLoRA на HSE Design

«У нуара есть настроение, которое чувствует каждый. Это люди в беде, ночью, с легким ветром и под правильную музыку. Это прекрасно.» — Дэвид Линч

Примеры изображений из датасета.

Концепция

Цель проекта — обучить генеративную нейросеть Stable Diffusion создавать оригинальные изображения в эстетике классического нуара. Нуар — это не просто чёрно-белая гамма, а целый набор визуальных и тематических кодов, таких как — контрастное светотеневое освещение, дождливые улицы, детективные сюжеты, образ роковой женщины, одиночество персонажа в большом городе. Задача нейросети — не просто перевести цветное изображение в чёрно-белое, а усвоить и воспроизвести эту сложную визуальную эстетику, создавая новые, аутентичные «кадры» из несуществующих нуар-фильмов.

Исходный размер 1000x1000

Примеры изображений из датасета.

Я считаю, что стиль нуар очень требователен к композиции и свету. Успешная передача этого стиля нейросетью станет демонстрацией её способности понимать не только текстуры, но и абстрактные художественные концепции. Результат — серия изображений, объединённых общим настроением тайны и драматизма, характерным для жанра.

Исходный размер 1000x1000

Примеры изображений из датасета.

Для обучения было собрано 102 квадратных изображения в стиле нуар. Источники: Wikimedia Commons и Google Images с фильтром по лицензии Creative Commons. Все изображения были приведены к разрешению 512× 512 пикселей.

Результаты

Исходный размер 1000x1000

Результаты.

Нейросеть Stable Diffusion усвоила эстетику классического нуара. Вместо простой черно-белой фильтрации, мы видим осмысленную работу со светом и тенью, которая является основой жанра. На всех картинках присутствует драматичный контраст, где источники света выхватывают из мрака либо лицо персонажа, либо создают характерные полосы тени от жалюзи. Нейросеть успешно передала не просто текстуру дождя или дыма от сигары, а именно тайны и тревоги, присущее нуару, доказав, что способна оперировать абстрактными художественными концепциями.

Исходный размер 1000x1000

Результаты.

Нейросеть создала изображения с основой на ключевые архетипы нуара. Мы видим двух центральных персонажей, а именно — «роковую женщину» и одинокого детектива.

Результаты.

«Женщина с пистолетом» и «Женщина в красном» представляют два состояния этого архетипа — активную угрозу (с пистолетом, агрессивная поза) и пассивную, но манящую опасность, где красный цвет как символ страсти и тревоги, который нейросеть корректно использовала даже в рамках черно-белой стилистики, сделав его смысловым акцентом.

«Детектив в офисе» и «Мужчина с сигарой» показывают вариации образа антигероя, погруженный в раздумья профессионал на рабочем месте и циничный персонаж в расслабленной, но напряженной позе в интерьере бара или казино. Это показывает, что нейросеть понимает контекст, где офис — это работа и одиночество, сигара — это размышление и статусность.

Результаты.

Мотив улицы

Отдельного внимания заслуживает изображение «Нуарная улица». Оно выступает в роли установочного кадра, задающего среду обитания персонажей. Здесь нейросеть отлично справилась с передачей городской текстуры, здесь есть всё — мокрая брусчатка или асфальт, отражающий неоновые вывески, темные переулки и перспектива улицы, уходящей в никуда. Этот кадр визуально дополняет портреты, создавая целостный мир, где разворачиваются детективные сюжеты, и подчеркивает тему «одиночества персонажа в большом городе», заявленную в концепции.

Результаты.

Процесс работы

Исходный размер 964x472

Для обучения использовался предоставленный ноутбук SDXL_DreamBooth_LoRA_Colab.ipynb (Исходный код в ссылках курса). Основные этапы процесса:

Первым делом — Подготовка среды, установка необходимых библиотек (diffusers, accelerate, peft, bitsandbytes) и проверка GPU.

Загрузка и подготовка датасета — фотографии загружены в Colab. Для автоматического создания промптов использовалась модель BLIP (Bootstrapping Language-Image Pre-training). Это позволило получить описательный текст для каждого изображения, что критически важно для DreamBooth-тренировки. Затем к каждой подписи был добавлен префикс с уникальным идентификатором стиля: noir style. Пример итоговой подписи: noir style, a detective standing under a street lamp in the rain.

Исходный размер 698x436

Обучение — процесс занял около 50 минут. Ключевая техника — LoRA. Вместо полной и дорогостоящей перетренировки модели, LoRA позволяет дообучить лишь небольшие сдвиги в весах, которые и отвечают за новый стиль. Это делает обучение быстрым и эффективным даже на бесплатном GPU T4 в Google Colab.

Сохранение результатов — после завершения обучения LoRA-веса сохранены локально для дальнейшего использования.

Исходный размер 2560x2560

Самая первая генерция.

Прогресс обучения нейросети можно отследить по первой генерации. Первая генерация выше — на ней много дефектов: проблемы с пальцами, лицами, освещением и общей стилистикой.

Итог

Итоговая серия изображений полностью соответствует замыслу проекта. Нейросеть успешно справилась с задачей воспроизведения сложной визуальной эстетики нуара, показав глубокое понимание света, композиции, архетипов персонажей и атмосферы. Каждое изображение вносит свой вклад в создание единого, драматичного и аутентичного нуарного мира, доказывая способность нейросети усваивать абстрактные художественные концепции и перерабатывать их в оригинальный визуальный продукт.

Результаты.

Использованные нейросети

Stable Diffusion XL — основной генеративный художник, создающий изображения в стиле нуар. BLIP — автоматическое создание текстовых описаний для изображений датасета. Deepseek — очистка кода, проверка, исправление ошибок.

Google Colab