The Cats of Louis Wain на HSE Design

Концепция проекта

Для своей работы я выбрала поздние картины Луиса Уэйна, поскольку в них присутствуют ярко выраженные и узнаваемые образы, где центральными персонажами выступают коты. Это позволило предположить, что нейросети будет проще сгенерировать визуально схожие изображения. Меня вдохновили такие яркие образы и мне захотелось создать нечто похожее и гипнотическое.

Помимо технических причин, на меня повлияло и личное восприятие. Серия работ Люиса Уэйна — глубокое переживание эмоций. Как студентке творческого направления, мне оказалось близко то, как личный опыт и эмоциональное состояние автора находят отражение в визуальной форме. Эти работы воспринимаются не только как иллюстрации, но и как способ выражения внутреннего мира, что делает их особенно интересными для анализа и интерпретации, а также для переосмысления с помощью современных технологий, таких как нейросети.

Исходный размер 1280x672

На изображениях выше видно, как творчество художника со временем становится все более ярким, нестандартным и узнаваемым.

Исходные изображения для обучения

Перед использованием работ Луиса Уэйна я ознакомилась с правилами их использования и сроками действия авторского права. Поскольку художник умер в 1939 году, его произведения перешли в общественное достояние по истечении установленного срока охраны авторских прав. Все изображения были взяты из открытых источников, в том числе из фотоархивов его работ.

Исходные изображения

Прежде всего я собрала картины, где еще прослеживается типичная кошачья мордочка, но в это же время и калейдоскопические узоры как и на фоне, так и на самих животных

Исходный размер 1024x1024

Процесс

Исходный размер 2257x837

Для обучения использовалась модель Stable Diffusion XL, адаптированная методом DreamBooth + LoRA. В качестве основы был взят Colab-ноутбук для SDXL DreamBooth LoRA, который позволяет дообучать модель на ограниченном пользовательском датасете. В ходе работы был введён собственный токен kaleidocat, связанный с набором выбранных изображений. Обучение проводилось на квадратном датасете с разрешением, ориентированным на SDXL-пайплайн. На промежуточных этапах использовались тестовые validation-промпты, чтобы отслеживать, насколько устойчиво модель воспроизводит характерные признаки выбранного визуального материала: фронтальность, орнаментальную структуру, деформацию кошачьей морды, симметрию и интенсивную палитру.

Результат обучения

Промпт: «a psychedelic ornamental cat portrait in kaleidocat style»

Чему удалось обучить нейросеть?

— Цветовое многообразие — Причудливые калейдоскопические узоры — Хаотичное и безумные образы — Сохранился облик котов — Фон многообразный и отличается между собой

Стартовые параметры:

— resolution: 1024 — train_batch_size: 2 — gradient_accumulation_steps: 3 — learning_rate: 1e-4 — max_train_steps: 500

— Stable Diffusion — обучение генеративной нейросети для воспроизведения выбранного художественного стиля. —Google Colab — облачная среда для написания кода, обучения модели и генерации изображений. — Hugging Face — платформа для получения токена доступа, а также для загрузки и хранения обученной модели. — Adobe Photoshop — использовался для предварительной обработки исходных изображений, в частности для их кадрирования.

Блокнот