Проект исследует детское творчество как форму визуальной свободы. Через обучение генеративной модели я хотела посмотреть на важные для меня сегодня вещи глазами себя из прошлого

рисунки из архива
Меня интересует не просто детский стиль, а свобода изображения. В детстве было легче экспериментировать, не думая о том, правильно ли получился рисунок. Итоговая серия стала попыткой восстановить это состояние через новые образы
датасет

рисунки из архива
Датасет состоит из моих сохранившихся детских рисунков и рисунков моих знакомых, которыми они поделились для проекта. Я обратилась к ним потому, что рисунков именно дошкольного возраста обычно сохраняется очень мало, и мне было важно расширить архив, сохранив его общую интонацию
рисунки из архива
На многих из них были подписи, перед обучением я предварительно удалила их в Photoshop, чтобы модель училась именно на рисунках, а не на тексте. При этом мне было важно сохранить фактуру бумаги и различия материалов, потому что это тоже часть визуального языка детских работ
рисунки из архива
процесс обучения
На основе предоставленного ноутбука был настроен процесс дообучения модели Stable Diffusion XL с помощью LoRA-адаптера. Для обучения был выбран подход, ориентированный на перенос визуального стиля, а не на генерацию одного конкретного персонажа или объекта


На следующем этапе были автоматически сгенерированы текстовые описания изображений и дополнены единым стилевым идентификатором, чтобы модель могла связать обучающие примеры с заданной художественной манерой. После подготовки metadata.jsonl был запущен процесс обучения LoRA на собранном наборе изображений.
результаты
В результате обучения модели Stable Diffusion методом LoRA на архиве моих детских рисунков и рисунков моих знакомых мне удалось получить серию новых изображений, которые сохраняют важные особенности исходного материала


генерации
prompt = «naive child drawing in KIDCRAYON style, everything is bad in a dark room, existential crisis, chaotic scribbles everywhere, no comfort, no hope»
prompt = «naive child drawing in KIDCRAYON style, a child at a crossroads with too many arrows pointing in different directions, confusion about life choices, preschool child drawing, crayons and markers»


генерации
prompt = «naive child drawing in KIDCRAYON style, everything is bad in a dark room, existential crisis, one lonely figure, black chaotic scribbles everywhere, no comfort, no hope, oppressive silence, authentic child drawing, crayons and markers on crumpled paper, visible folds and texture, naive awkward composition, emotionally painful»
Я меняла параметр lora_scale от 0.5 до 1.0 и сравнивала результаты при одном и том же промпте. Я заметила, что чем меньше это значение, тем более взрослый и мрачный получался рисунок
генерация
prompt = «naive child drawing in KIDCRAYON style, everything is bad in a dark room, existential crisis, one lonely figure, black chaotic scribbles everywhere, no comfort, no hope, oppressive silence, authentic child drawing, crayons and markers on crumpled paper, visible folds and texture, naive awkward composition, emotionally painful»


генерации
prompt = «naive child drawing in KIDCRAYON style, a broken toy bear with big eyes lying on the floor, child drawing, sadness and memory»
prompt = «naive child drawing in KIDCRAYON style, a grown old cat with tired green eyes sitting on a windowsill, authentic preschool child drawing, wax crayons, quiet sad atmosphere»
Некоторые «ошибки» генерации в рамках этого проекта воспринимаются не как технические сбои, а как органичная часть детской визуальной логики. Например, если у медведя появляется не четыре лапы, а шесть, это скорее считывается как продолжение детского воображения, в котором форма не обязана подчиняться реалистическим правилам
генерация
prompt = «naive child drawing in KIDCRAYON style, everything is bad in a dark room, existential crisis, one lonely figures, black chaotic scribbles everywhere, no comfort, no hope, oppressive silence, authentic child drawing, crayons and markers on crumpled paper, visible folds and texture, naive awkward composition, emotionally painful»
Наиболее убедительными получились генерации, в которых детская визуальность соединяется с темами, важными для меня сейчас. Благодаря этому итоговая серия стала способом посмотреть глазами ребенка без самоцензуры на взрослые вопросы


генерации
prompt = «naive child drawing in KIDCRAYON style, a giant clock hanging over a tiny bed, pressure of time, anxiety, drawn like a child, crayons and colored pencils on wrinkled paper»
prompt = «naive child drawing in KIDCRAYON style, existential crisis, one lonely figure, haotic scribbles everywhere, no comfort, no hope, oppressive silence, authentic preschool child drawing, crayons and markers on crumpled paper, visible folds and texture, naive awkward composition, emotionally painful»
генерация
prompt = «naive child drawing in KIDCRAYON style, a child holding a heart while others hold stars and trophies, difference and loneliness, naive symbolic drawing


генерации
prompt = «naive child drawing in KIDCRAYON style, a mother with gray hair near children, childlike drawing with tenderness and sadness»
prompt = «naive child drawing in KIDCRAYON style, an empty room with one chair, one window and a toy left on the floor, drawn like a preschool child, crayons on wrinkled paper, lots of white background, simple emotional loneliness»
сравнение оригинальных рисунков и генераций
Не случайно в детстве мы рисуем именно то, что для нас действительно важно. Это те образы, которые ребёнок видит чаще всего, через которые начинает чувствовать мир. Поэтому в детских рисунках так часто появляются одни и те же сюжеты


рисунок мамы из личного архива раньше и генерация мамы сейчас
prompt = «naive child drawing in KIDCRAYON style, an old mother with gray hair sitting on a small chair, authentic preschool child drawing, wax crayons and colored pencils on wrinkled paper, visible folds, naive composition, awkward proportions, emotionally direct»


рисунок любимого кота из личного архива раньше и генерация сейчас
prompt = «naive child drawing in KIDCRAYON style, a black cat with green eyes in a quiet room, old and calm, child drawing, emotional stillness»


автопортрет раньше из личного архива и и автопортрет генерация сейчас
prompt = «naive child drawing in KIDCRAYON style, a child speaking and only black scribbles come out instead of words, nobody understands, child drawing»
Сейчас эти вещи остаются важными для меня, но ощущаются уже иначе. Если раньше они были просто естественной частью жизни, то теперь к ним добавляются память, чувство времени, тревога, нежность и осознание того, как всё меняется
вывод
Проект стал для меня попыткой вернуться к более свободному состоянию творчества и посмотреть на важные для меня вещи одновременно глазами прошлого и настоящего. Теперь я знаю, что детский рисунок можно не только сохранить как память, но и продолжить как живой визуальный язык
описание применения генеративной модели
В проекте использовалась Stable Diffusion, дообученная методом LoRA на детских рисунках, для генерации новой серии изображений в логике исходного архива.
ChatGPT использовался как вспомогательный инструмент для анализа изображений, составления промптов и оформления текста




