Идея проекта
Для обучения генеративной нейросети я решила использовать свой проект «Блеск бокалов». Он представляет собой серию из 10 фотографий о коктейлях и сочетает 2 типа снимков: close-up и натюрморт.
Главная цель проекта — проследить, насколько ИИ сможет попасть в атмосферу проекта, повторить детали и основные приемы. Посмотреть, сможет ли он создать продолжение этой серии фотографии.
Оригинальные изображения я обрезала в квадратный формат для дальнейшего обучения нейросети

Основные элементы, которые характеризуют проект:
— изображение коктейлей с их собственным характером и особенной атмосферой
— цветовая палитра (розовый, красный, голубой, желтый, темно-зеленый)
— разбивка на 2 типа снимков: close-up / натюрморт
— контрастный свет
Дальше я буду стараться сохранить именно эти черты в генеративном продолжении проекта

скриншот части обучения нейросети
Первые генерации


prompt: product photo in VVIEQUEL style, a glass of red drink with a lemon slice on top of it
В первых промптах получается визуально повторить close-up фотографии, однако в них не хватает некоторых особенностей света
Дальше будет решено добавить в промпт упоминания контрового света.


prompt: product photo in VVIEQUEL style, a glass of purple drink with an orange slice on top of it
Добавление в промпт «backlight»


prompt: (1) product photo in VVIEQUEL style, a glass of purple drink with an orange slice on top of it with backlight (2) product photo in VVIEQUEL style, a martini glass of dark liquid with backlight
Контровой свет помогает передать характер оригинального проекта в его генеративном продолжении
prompt: product photo in VVIEQUEL style, a martini glass of dark liquid with backlight


prompt: (1) product photo in VVIEQUEL style, close-up, a glass of prink water with contrast light (2) product photo in VVIEQUEL style, a glass of red drink with a lemon slice on top of it with backlig
Натюрморты


prompt: (1) product photo in VVIEQUEL style, a glass of wine next to dark green velvet with contrast light (2) product photo in VVIEQUEL style, a glass with orange liquid on a wooden board with a lemo
В первых генерациях ИИ создает натюрморты слишком живописными, а композицию в них — слишком академической. Однако в генерациях уже заметен собственный характер каждого бокала
В оригинальной серии кадр заполнен практически полностью, в снимке не так много воздуха, а композиция стремится к диагонали


prompt: product photo in VVIEQUEL style, a glass with yellow liquid, around vinyl records, books and dark green textile
В следующих генерациях композиция становится более хаотичной, у нейросети уже лучше получается передавать характер и движение оригинальных фотографий


prompt: (1) product photo in VVIEQUEL style, a glass with orange liquid on a wooden board with a (2) product photo in VVIEQUEL style, a martini glass of dark liquid next to cds, cassettes and glasses
prompt: product photo in VVIEQUEL style, a martini glass of dark liquid next to cds, cassettes and glasses
Итоги
Подводя итог этому проекту, можно заметить, что нейросеть не может до конца повторить авторский стиль, возможно, для этого необходимо большее количество изображений для обучения. Однако мы можем заметить, что с некоторыми изменениями в промптах можно добиться достойного сходства, а многие сгенерированные изображения могут дополнить оригинальную серию и смотреться в ней органично.


Использованные инструменты: — Stable Diffusion — обучение генеративной нейросети под свой стиль; — Google Colab — выполнение кода и генераций; — Hugging Face — получение токена для обучения нейросети, загрузка полученной модели на сайт; — ChatGPT — помощь со сложностями в коде




