Генеративные сети отлично справляются с классическим фэнтези: блестящие рыцари, ужасающие орки и эпические замки даются им легко благодаря огромному количеству современного арта в их базе данных. Но что, если задача — сгенерировать тихую, меланхоличную скандинавскую сказку, где монстры не злые, а являются органичной частью самой природы?
Данный исследовательский проект посвящен оцифровке стиля Йона Бауэра — выдающегося шведского художника и иллюстратора начала XX века, чьи работы к циклу сказок «Среди эльфов и троллей» стали абсолютным каноном северного фольклора.


Искусство Бауэра — это глухие, темные еловые леса, покрытые густым мхом валуны и поразительный контраст масштабов: крошечные, хрупкие принцессы с длинными светлыми волосами на фоне гигантских, неуклюжих, но по-своему добродушных троллей.
Обучение генеративной модели на этих картинах — это сложнейший стресс-тест на понимание атмосферы и цвета. Нейросети по умолчанию тяготеют к ярким, насыщенным цветам и 3D-объему. Стиль Бауэра требует от алгоритма использовать приглушенную, «землистую» палитру (мшисто-зеленые, коричневые и серые тона), а также объединять декоративную плоскостность модерна (ар-нуво) с глубокой атмосферной перспективой туманного леса. Кроме того, заставить ИИ нарисовать тролля, который выглядит как оживший древний камень или пень, а не как агрессивный монстр из видеоигры — нетривиальная задача для инженера.
Ниже представлены некоторые работы Йона Бауэра, вошедшие в базу данных для обучения искусственного интеллекта.






Техническая реализация (Google Colab и LoRA)
В рамках проекта обучение проводилось в облачной среде Google Colab с использованием метода LoRA (Low-Rank Adaptation). Этот подход позволяет дообучить тяжелую базовую модель (например, Stable Diffusion), обновляя лишь небольшую часть алгоритмов, что делает процесс быстрым и эффективным.
Чтобы сделать процесс наглядным, весь технический этап (пайплайн) разбит на четыре ключевых шага:
1. Проверка оборудования (Видеокарта)
Генерация и обучение нейросетей требуют мощных видеокарт (GPU). На этом шаге мы инициализируем сервер и проверяем, какой именно вычислительный ресурс выдал нам облачный сервис Google для работы.
2. Подключение датасета и установка программ
Мы подключаем облачный диск, на котором лежат бережно отобранные нами картины художника (датасет), и скачиваем необходимые библиотеки машинного обучения (такие как diffusers и accelerate). Это дает нашему коду «инструменты» для работы с изображениями.
3. Запуск обучения (Тренировка стиля)
Это кульминация технического процесса. Здесь мы передаем нейросети команду: «Возьми базовую модель, проанализируй картины в нашей папке и найди в них общие стилевые черты». Процесс идет шаг за шагом (steps), пока нейросеть не выучит уникальный почерк художника, связав его со специальным кодовым словом (триггером).


4. Генерация первой картинки (Инференс)
После завершения обучения мы тестируем результат. Пишем текстовый запрос (промпт), используем выученное кодовое слово, и нейросеть «рисует» совершенно новое изображение в только что освоенном стиле.
Работы Йона Бауэра отличаются ярким, узнаваемым стилем, который характеризуется несколькими ключевыми особенностями: • Меланхоличная, приглушенная цветовая палитра: глубокие зеленые, коричневые и серые оттенки сырого леса. • Экстремальный контраст масштабов: крошечные, изящные люди на фоне исполинских троллей или гигантских деревьев. • Органичный дизайн существ: тролли Бауэра кажутся продолжением природы (похожи на валуны, поросшие мхом и корнями). • Влияние стиля ар-нуво: плавные, декоративные линии в изображении волос, крон деревьев и складок одежды. • Рассеянный, бледный свет, пробивающийся сквозь густой туман или кроны вековых сосен.
Примеры сгенерированных изображений и промпты
Для тестирования модели и раскрытия её потенциала были составлены специальные промпты, проверяющие разные аспекты стиля:
Мальчик и лось
«A young boy riding a giant, gentle moose through a dark, enchanted Nordic forest, photo in Bayer style, Art Nouveau illustration, soft pale lighting, magical atmosphere.»
Дух воды
«A pale, mystical water spirit sitting on a dark, wet rock in the middle of a calm forest lake at twilight, photo in Bayer style, melancholic mood, deep greens and blues, delicate linework.»
Лесная корона
«A close-up of a beautiful, pale elven queen wearing a crown made of pinecones and tangled roots, photo in Bayer style, traditional Scandinavian fairy tale, flowing hair, muted palette.»
Древние валуны
«A landscape of massive, round moss-covered boulders in a thick, dark spruce forest, some of the rocks look like sleeping trolls, photo in Bayer style, eerie but peaceful nature, atmospheric perspective.»
Встреча в лесу
«A massive, ancient troll covered in moss and roots looking curiously at a tiny, delicate princess with long blonde hair, photo in Bayer style, Swedish folklore, muted earthy colors, dense foggy pine forest.»
Три тролля
«Three grotesque, giant, clumsy trolls with large noses discussing something in a dark cave, illuminated by a single pale beam of light, photo in Bayer style, folk art, earthy brown and grey tones.»
Спящий великан
«A gigantic forest giant sleeping peacefully, his body entirely covered in grass, small trees, and creeping vines, photo in Bayer style, integration of character and landscape, muted natural colors.»
Танец эльфов
«Tiny, ethereal fairies dancing in a circle over a foggy swamp, watched by a large, hidden woodland creature, photo in Bayer style, ethereal lighting, vintage storybook aesthetic.»
Звёздное небо
«A silhouette of a lonely traveler standing on a cliff, looking up at a vast, pale starry sky over a dark pine forest, photo in Bayer style, quiet melancholy, flat decorative composition.»
Подземный король
«An ancient, bearded gnome king sitting on a throne of twisted roots holding a glowing crystal, photo in Bayer style, mythical underground world, delicate Art Nouveau details, soft glow.»
Заблудившаяся девочка
«A small girl wrapped in a thick winter shawl walking through an imposing, terrifyingly large winter forest, deep snow, bare twisted branches, photo in Bayer style, Nordic winter, quiet isolation.»
Замок на горе
«A tiny, dark wooden fortress sitting on top of an impossibly steep, jagged mountain peak, shrouded in mist, photo in Bayer style, epic folklore scale, minimalist illustration style.»
Современная сказка (Стресс-тест)
«A modern city street at dusk, but the buildings are twisted and organic like giant ancient trees, tiny commuters walking below, photo in Bayer style, urban fairy tale, delicate line work, foggy atmosphere.»
Киберпанк-тролль (Стресс-тест)
«A towering cyberpunk mech overgrown with moss and cables, standing in a misty pine forest like an ancient troll, photo in Bayer style, retro-futuristic folklore, muted green and brown palette.»
Как мне кажется, нейросети удалось приблизиться к уникальному стилю Йона Бауэра и передать его. В изображениях можно уловить тихую, завораживающую атмосферу скандинавских сказок, любовь к приглушенным землистым оттенкам и фирменный масштаб гигантских, заросших лесом существ.
И все же нельзя не отметить, что сгенерированные нейросетью изображения далеки от идеала. Главная проблема ИИ — это борьба с «голливудскими» стереотипами. Вместо неуклюжих, добродушных и похожих на валуны троллей Бауэра, нейросеть часто генерирует агрессивных, клыкастых монстров, свойственных современному фэнтези. Также модель периодически «срывается» в излишнюю насыщенность цветов, теряя ту самую серую, туманную меланхолию, присущую оригиналам. Кроме того, тонкие, декоративные линии ар-нуво (особенно в прорисовке длинных светлых волос принцесс) часто размываются, уступая место стандартному цифровому объему. Все эти вещи могут быть замечены даже непрофессиональным взглядом человека, не имеющего искусствоведческого образования.
Вывод
Эксперимент с оцифровкой сказочного наследия Йона Бауэра в очередной раз доказывает, что стиль — это не только набор цветов и линий, но и культурный код. Современные нейросети (такие как Stable Diffusion 3.5, FLUX.1 или Midjourney v6) превосходно улавливают макроуровень: они могут нарисовать густой туман, дремучий лес и выстроить нужный контраст масштабов. Однако ИИ с трудом постигает внутреннюю философию художника. Для Бауэра природа Швеции была живой, одушевленной и глубоко мистической, а его тролли были её хранителями, а не врагами. Нейросеть же опирается на усредненные статистические данные, где «монстр в лесу» по умолчанию означает угрозу и агрессию. Именно поэтому машинным генерациям часто не хватает той трогательной, тихой нежности, которая делала иллюстрации Бауэра великими. Тем не менее, способность ИИ адаптировать эстетику шведского фольклора под любые запросы поражает. Это дает современным иллюстраторам и разработчикам инди-игр невероятный инструмент для создания атмосферных, глубоких миров, пропитанных магией и очарованием старых европейских сказок.
Применение генеративной модели
Для генерации промптов и разработки индивидуализированной структуры текста был использован Claude 4.5 Sonnet.




