Нейросеть обучается на репрезентативной базе данных картин знаменитого художника, изучая композицию, цветовую палитру, технику мазка, особенности освещения и другие ключевые элементы, формирующие его уникальный художественный почерк.
«Триптих искушения святого Антония», 1501
Художником, чьи работы стали основой данного проекта, является Иероним Босх — нидерландский потомственный живописец, один из самых загадочных мастеров Северного Возрождения. Босх вошел в историю как праотец сюрреализма.
Сад земных наслаждений, 1515 г.
Интерес к оцифровке стиля Иеронима Босха с помощью нейросетей обусловлен тем, что его искусство — это абсолютный концептуальный слом для искусственного интеллекта. Генеративные модели обучаются на логике и правильной анатомии. Если нейросеть рисует птицу, она дорисовывает ей крылья. Если рисует человека, то дает ему две руки. Стиль Босха требует от ИИ осознанно генерировать абсурд: соединять несовместимые объекты (ножи, уши, жаб, людей, музыкальные инструменты) в единых, цельных химер. Кроме того, плотность мелких, логически не связанных друг с другом сцен на одном полотне заставляет алгоритмы путаться, скатываясь в бессмысленную визуальную кашу. Научить нейросеть создавать детализированный, упорядоченный хаос — задача высочайшего уровня сложности.
«Искушение святого Антония» 1501 г.
Сад земных наслаждений, 1515 г.
Техническая реализация
В рамках проекта обучение проводилось в облачной среде Google Colab с использованием метода LoRA (Low-Rank Adaptation). Этот подход позволяет дообучить тяжелую базовую модель (например, Stable Diffusion), обновляя лишь небольшую часть алгоритмов, что делает процесс быстрым и эффективным.
Чтобы сделать процесс наглядным, весь технический этап (пайплайн) разбит на четыре ключевых шага:
1. Проверка оборудования
Генерация и обучение нейросетей требуют мощных видеокарт (GPU). На этом шаге мы инициализируем сервер и проверяем, какой именно вычислительный ресурс выдал нам облачный сервис Google для работы.
2. Подключение датасета и установка программ
Мы подключаем облачный диск, на котором лежат бережно отобранные нами картины художника (датасет), и скачиваем необходимые библиотеки машинного обучения (такие как diffusers и accelerate). Это дает нашему коду «инструменты» для работы с изображениями.
3. Запуск обучения
Это кульминация технического процесса. Здесь мы передаем нейросети команду: «Возьми базовую модель, проанализируй картины в нашей папке и найди в них общие стилевые черты». Процесс идет шаг за шагом (steps), пока нейросеть не выучит уникальный почерк художника, связав его со специальным кодовым словом (триггером).
4. Генерация первой картинки
После завершения обучения мы тестируем результат. Пишем текстовый запрос (промпт), используем выученное кодовое слово, и нейросеть «рисует» совершенно новое изображение в только что освоенном стиле.
«A modern office cubicle maze where the workers are being tormented by bizarre demons made of giant staplers and keyboards, photo in Bosh style, modern hellscape, absurd surrealism.»
Работы Иеронима Босха отличаются ярким, узнаваемым стилем, который характеризуется несколькими ключевыми особенностями: Конструирование химер, сюрреалистичная архитектура, огромная плотность деталей и микросюжетов, характерная палитра Северного Возрождения (светло-зеленые, розовые, нежно-голубые для Рая и огненные тона для Ада), отсутствие классической перспективы.
«A massive lute being used as an intricate torture device for tiny sinners in a dark hellscape, photo in Bosh style, grotesque demons, dark fiery background, macabre surrealism.»
результаты
результаты
В изображениях можно уловить характерную атмосферу макабра, попытки конструировать гротескных химер, узнаваемую технику масляной живописи Возрождения и эпический масштаб галлюциногенных ландшафтов.
Вывод
Эксперимент с оцифровкой безумных миров Иеронима Босха наглядно демонстрирует, где пролегает текущая граница возможностей искусственного интеллекта. Современные нейросети (Stable Diffusion 3.5, FLUX.1 или Midjourney v6) безупречно усваивают цвет, текстуру старого холста и общую эстетику сюрреализма.
результаты