Моя семья привыкла называть нашего домашнего кота Кристофера «принцем», это очень подходит его характеру. Но мне всегда было интересно, как бы Крис выглядел, будь он не принцем, а кем-нибудь другим. С помощью нейросети я смогла создать несколько изображений моего кота в разных образах.


prompt = «a photo of a cat in krisstyle, wearing a pirate hat and eyepatch, standing on a pirate ship, treasure chest nearby» # @param
image = pipe (prompt=prompt, num_inference_steps=25).images[0] image

Крис Пират
prompt = «a photo of a cat in krisstyle, wearing a superhero cape, flying over a city, heroic pose» # @param
image = pipe (prompt=prompt, num_inference_steps=25).images[0] image

Крис Супергерой
prompt = «a photo of a cat in krisstyle, wearing samurai armor, holding a katana, ancient Japan background» # @param
image = pipe (prompt=prompt, num_inference_steps=25).images[0] image
Крис Самурай
prompt = «a photo of a white cat in krisstyle, next to an easel, colorful palette nearby» # @param
image = pipe (prompt=prompt, num_inference_steps=25).images[0] image
Крис Художник
prompt = «a photo of a cat in krisstyle, wearing a golden crown, sitting on a throne, royal palace background» # @param
image = pipe (prompt=prompt, num_inference_steps=25).images[0] image
Крис Король
prompt = «a photo of a cat in krisstyle, wearing a chef hat, cooking in a professional kitchen, surrounded by pots and pans» # @param
image = pipe (prompt=prompt, num_inference_steps=25).images[0] image
Крис Повар
prompt = «a photo of a cat in krisstyle, wearing a wizard hat, casting a spell, magical sparkles around» # @param
image = pipe (prompt=prompt, num_inference_steps=25).images[0] image
Крис Волшебник
prompt = «a photo of a cat in krisstyle, sitting at a computer, coding, multiple screens, coffee cup nearby» # @param
image = pipe (prompt=prompt, num_inference_steps=25).images[0] image
Крис Программист
prompt = «a photo of a white cat in krisstyle, wearing a cowboy hat, wild west landscape» # @param
image = pipe (prompt=prompt, num_inference_steps=25).images[0] image
Крис Ковбой
prompt = «a photo of a cat in krisstyle, wearing knight armor, holding a sword, medieval castle background» # @param
image = pipe (prompt=prompt, num_inference_steps=25).images[0] image
Крис Рыцарь
Итоговые изображения получились интересными и похожими на моего кота. Мне особенно понравилось, как нейросеть смогла сохранить особенности освещения в моей квартире и при этом перенести их в другие локации.
Кристофер смог побывать в роли самурая, повара и даже пирата. Теперь нашей семье будет легче представлять, что наш кот не просто самодовольный лентяй :)
Создание кода
Обучение и генерация изображений происходило на базе Stable Diffusion.
Для обучения нейросети я использовала датасет из 26 квадратных фотографий Кристофера в высоком разрешении.
В началае создается необходимая среда, затем загружается датасет из фотографий. С помощью BLIP к ним генерируются подписи.
Потом был создан DreamBooth «krissstyle» и обучена LoRA модель.
Обучение проводилось с разрешением 512×512 пикселей, размером батча 2, накоплением градиента 3 шага и всего 500 шагов.
После обучения обученные веса LoRA были сохранены файлом на мой компьютер и потом я создавала изображения прямо в блокноте.
Описание применения генеративной модели
Я использовала генеративную нейросеть Depseek для помощи мне в освоении ньюансов работы с кодом и генерации идей для финальных изображений Криса.















