Референсные кадры






Идея проекта
С детства «Флинстоуны» были одним из моих любимых мультсериалов, поэтому я решил обучить генеративную модель на нем, чтобы вновь окунуться в беззаботные воспоминания.
Все изображения были предварительно подготовлены к обучению: переведены к одному размеру и формату
Получившиеся изображения
В целом модель достаточно хорошо уловила рисовку, общие пропорции и цветовую палитру. Передача эмоций героев примитивна, но довольно понятна.


В некоторых изображениях даже можно узнать главного героя Фреда Флинтстоуна.
Есть мягко говоря и проблемные места. С каждой новой генерацией, модель все больше уходила в сюрреализм и переставала даже пытаться обработать конечности и нарисованные лица персонажей:




Вывод: Генеративная модель смогла очень хорошо передать общую стилистику анимации, цветовые решения, даже иногда эмоции персонажей были читаемы. Однако с детальной проработкой у модели остались проблемы. Лица в большинстве случаев сильно размазаны, а конечности не имеют четких форм.
Описание процесса
Могу предположить, что неудачные генерации также можно связать с попыткой оптимизировать генеративную модель, так как в начале модель постоянно вылетала из-за нехватки системной памяти в Google Collab.
Для оптимизации процесса обучения я прибегал к Gemini







