Концепция
Лоцман —это кличка моей собаки, которую я безумно люблю. Однако в морской терминологии «лоцман» — это специалист, который проводит суда через сложные участки.
В проекте это совпадение становится отправной точкой. Таким образом в рамках визуального ряда Лоцман отправляется в свой первый круиз, посещая разные страны и города.
Исходные фотографии Лоцмана
Первый круиз Лоцмана

Промпт к фотографии

В ожидании круиза
Первая фотография сделана на фоне круизного лайнера. Лоцман в ожидании начала своего путешествия.
Промпт к фотографии
Рим
Первой страной, которая встретила Лоцмана, была Италия (Рим). Фотография сделана на фоне всем известного Колизея (Амфитеатра Флавиев).
Один промпт для двух фотографий
Барселона
Следующей остановкой стала Испания, а именно Барселона, где Лоцману посчастливилось поучаствовать в карнавале.
Мне кажется, ему очень идёт этот костюм)
Промпт к фотографии
Вкусный обед
Но между поездками в разные страны не стоит забывать перекусить в ресторане круизного лайнера.
Промпт к фотографии
Тихий час
Также важно беречь энергию и следить за режимом сна, чтобы хватало сил на длительные прогулки по улицам городов.
Промпты к фотографиям
Греция
Третьей страной, которую посетил Лоцман, стала Греция. Ему посчастливилось увидеть Парфенон и погулять по улочкам города.
Промпт к фотографии
Аквапарк
Во время длительных переходов нужно брать максимум от путешествия и пробовать все развлечения на круизном лайнере, например, сходить в аквапарк.
Промпт к фотографии
Отдых на лежаке
А после активного отдыха в бассейне — отдохнуть на лежаке.
Промпт к фотографии
Франция
Следующая фотография сделана во Франции на фоне Эйфелевой башни.
Промпт к фотографии
Великобритания
Заключительной страной круизного путешествия стала Великобритания. Фотография сделана на фоне Биг-Бена.
Вывод
По завершении работы с генеративной нейросетью можно сделать вывод, что фотографии получились довольно реалистичными и живыми. Нейросеть хорошо уловила характер и внешность Лоцмана, а также точно передала атмосферу каждой сцены.
В итоге у Лоцмана получился не просто фотоальбом, а настоящая история его первого путешествия — с новыми впечатлениями, открытиями и яркими моментами.
Обучение генеративной нейросети
Для до-обученя в данном проекте мною была использована генеративная нейросеть Stable Diffusion.
Также был собран датасет из 15 квадратных (1:1) фотографий Лоцмана (хорошего качества).
Для начала были установлены библиотеки bitsandbytes и diffuseres. И скачен обучающий скрипт для модели.
Затем был загружен датасет с фотографиями Лоцмана и проверен считывается ли он.
Затем были созданы подписи к фотографиям, которые необходимы для обучения.
Далее модель обучается с инструментом LoRa.
Начало обучения генеративной модели.
Затем сохраняем модель на huggingfacehub для генерации новых изображений.















