Введение
Импрессионизм — направление, которое навсегда изменило историю искусства. Вместо четких линий и академической гладкости — живые, трепетные мазки, игра света и воздуха, эмоция, застывшая на холсте.
Киберпанк — эстетика будущего. Неоновые огни, отражающиеся в мокром асфальте, летающие автомобили, голографические вывески, дождь, растворяющий границы между реальностью и цифрой. Это мир высоких технологий и низкой жизни, где город никогда не спит, а искусственный свет создает свою, особенную атмосферу.
Что если соединить их? Что если мазки импрессионистов засияют неоном, а привычные киберпанк-сюжеты обретут живописную мягкость и эмоциональность? Меня всегда завораживала эта идея — создать нечто новое, синтетическое, где два, казалось бы, противоположных мира встречаются и рождают уникальный визуальный язык.
Цель проекта
Научить генеративную нейросеть воспроизводить этот уникальный синтетический стиль «Импрессионный киберпанк», чтобы создавать новые изображения, сохраняющие ключевые черты обоих направлений: живописную фактуру мазка, неоновую цветовую гамму, динамику света и технологическую эстетику.
Основная гипотеза заключалась в том, что Stable Diffusion XL, дообученная с помощью техники DreamBooth и LoRA на качественном датасете, собранном вручную, сможет не просто механически смешивать элементы, а уловить и воспроизвести эту сложную, гибридную эстетику. Технология DreamBooth позволяет научить модель новому понятию, используя ограниченное количество примеров, благодаря механизму prior preservation loss, который защищает модель от «забывания» того, что она уже знает о мире.
Датасет для обучения
Для обучения я собрала 30 изображений, представляющих собой синтез импрессионизма и киберпанка. Источниками стали работы современных цифровых художников, экспериментирующих с fusion-стилями, а также обработки классических импрессионистских картин, переосмысленные в киберпанк-эстетике.
В датасет вошли разные сюжеты:
— Городские пейзажи: неоновые улицы, дождливые перекрестки, летающие автомобили — Фантастические сцены: голографические сады, цифровые существа, технологические храмы — Персонажи: гейши с голографическими элементами, роботы, киберпанк-самураи
Выбирались изображения с наиболее ярко выраженными чертами обоих стилей — характерной живописной текстурой и насыщенной неоновой палитрой, чтобы модель могла уловить не просто сюжеты, а саму манеру этого гибридного стиля.
Важным этапом подготовки стала генерация промптов для каждого изображения с помощью модели BLIP. Это позволило создать подписи, связывающие визуальный контент с текстом — ключевое условие для успешного DreamBooth-обучения. К каждому сгенерированному описанию добавлялся единый префикс — триггерная фраза «cyberpunk impressionism style».
Процесс обучения
Процесс обучения проходил в среде Google Colab с использованием GPU Tesla T4.
После установки необходимых библиотек был написан код для загрузки изображений в папку ./CyberpunkImpressionism/. Затем модель BLIP сгенерировала для них текстовые описания, к которым был добавлен префикс «cyberpunk impressionism style». Все подписи были сохранены в файл metadata.jsonl, связывающий имена файлов с промптами.
Создание папки для датасета «Импрессионный киберпанк»
Загрузка изображений
Генерация подписей в стиле «Импрессионный киберпанк»
Запуск обучения
Ключевые параметры обучения: — Разрешение: 768×768 — Количество шагов: 500 — Learning rate: 1e-4 — Batch size: 2 (с gradient accumulation steps = 3) — Оптимизатор: 8-bit Adam — Mixed precision: fp16
Обучение заняло около 1 часа. Финальное значение loss составило 0.162, что свидетельствует о хорошей сходимости модели.
После завершения обучения веса LoRA были сохранены локально в папке cyberpunk_impressionism_lora. Модель готова к использованию для генерации изображений в новом, авторском стиле.
Результат
Модель успешно усвоила ключевые элементы стиля «Импрессионный киберпанк». На всех сгенерированных изображениях видна характерная живописная фактура — мазки негладкие, текстурные, «живые», словно нанесенные кистью художника. Это особенно заметно в небе, облаках, водной глади и фонах.
Модель хорошо воспроизводит неоновую, насыщенную палитру — контрастные пурпурные и циановые тона, электрик-блю, розовые и ярко-оранжевые акценты. Даже на новых, незнакомых сюжетах цвета «звучат» по-киберпанковски, сохраняя при этом живописную глубину.
Удалось передать динамику: изогнутые линии неоновых вывесок, пульсирующий свет, отражающийся в мокром асфальте, экспрессивные облака, подсвеченные снизу городским сиянием. Композиции не статичны, они «дышат» и переливаются.
Примеры сгенерированных изображений:
- «holographic geisha in futuristic alley, neon pink and electric blue, loose impressionist style»
Персонаж и окружение сливаются в единую живописную композицию, где яркие неоновые цвета наложены широкими, свободными мазками.
- «digital rain over traditional temple, glowing cherry blossoms, vibrant colors, impressionist strokes»
Здесь модель показывает способность работать со сложными композициями, где традиционная японская эстетика (храм, сакура) переосмысляется через призму киберпанка и импрессионистской манеры.
Описание применения генеративной модели (ГенИИ)
Разработанная модель открывает широкие возможности для творческого и коммерческого использования. Генеративный искусственный интеллект в данном случае выступает не просто инструментом, но соавтором, способным интерпретировать и развивать художественные идеи.
Stable Diffusion XL — базовая модель для генерации изображений. BLIP — генерация текстовых описаний для обучающих изображений. LoRA — техника эффективной дообучения модели на новом стиле. DreamBooth — метод обучения, позволяющий внедрить новое понятие в модель с сохранением prior preservation loss Google Gemini — помогал в исправлении ошибок кода
Источники изображений для датасета




