Концепция
Как обучающемуся на направлении анимация, мне было интересно взять датасет по теме мультфильмов. Захотелось проанализировать топ Imdb (датасет называется TopAnimatedImDb.csv), чтобы узнать, какой мне нужно снять мультфильм, чтобы стать успешным (известным и богатым) аниматором и не умереть под мостом.
Для визуализации данных выбраны: круговая диаграмма; столбчатая диаграмма; точечная диаграмма; коробчатая диаграмма.
Первые две взяты, чтобы была видна разница в сравнении между данными, чего больше, чего меньше. Вторые две, чтобы лучше видеть отдельные данные, чем сравнение в целом.
Так как датасет на английском языке, то я решила название диаграмм и осей также делать на английском, чтобы согласовывалось с подписями.
Обложка проекта сделана в leonardoAI. Промпт: A young girl sits at an animation table late at night, focused on drawing a cartoon character. The dim glow of her desk lamp illuminates her workspace, casting soft shadows. The room has a cozy yet artistic atmosphere, with sketches, animation frames, and pencils scattered around. The scene is bathed in a harmonious color palette of deep mauve (#AA4465), teal (#2CA6A4), seafoam green (#5EC2B7), dark gray-blue (#364652), and pastel cyan (#9DD9D2), creating a dreamy and creative ambiance. The background shows a nighttime window with a deep blue sky, subtly reflecting the colors of her workspace, 2d style.
Обработка данных
Сначала были импортированы необходимые библиотеки: pandas, matplotlib.pyplot, seaborn. После csv-файл, скачанный с сайта kaggle.com, был добавлен в google colab.
Круговая диаграмма и возрастной рейтинг
Для круговой диаграммы («Distribution of Cartoon Certificates») была создана переменная certificate_counts, в которой по столбцу certificate подсчитано количество мультфильмов с одинаковым рейтингом. Построена диаграмма.
Получив простую диаграмму, я пошла в chatgpt, чтобы узнать, как поменять цвет фона с белого на нужный мне, так как эта задача оказалась мне не под силу. Промпт: «I have this code <…> How change background’s colour?»
После в фотошопе на график была накинута текстура для красоты.
Распространённые возрастные рейтинги. Круговая диаграмма.
Стало понятно, что следует выбрать рейтинг U.
(Фильмы с сертификатом U подходят для неограниченного публичного показа и подходят для семейного просмотра. Эти фильмы могут содержать универсальные темы, такие как образование, семья, драма, романтика, научная фантастика, боевик и т. д. Эти фильмы также могут содержать умеренное насилие, но оно не может быть продолжительным. Он также может содержать очень мягкие сексуальные сцены (без каких-либо следов обнаженной натуры или сексуальных деталей)
Столбчатая диаграмма и жанры
Для следующей диаграммы («Total Gross Earnings by Cartoon Genre») надо было преобразовать данные столбца Gross. Знак доллара и буквы заменены (replace) пустотой и переведены из строк в float.
После в genre_gross с помощью groupby подсчитана сумма, сколько каждый жанр заработал в целом. Потом это было сортировано.
Построена столбчатая диаграмма. С изменением цвета фона помог chatgpt (промпт тот же), так как попытка сделать самостоятельно по аналогии с предыдущим графиком провалилась. В фотошопе накинута текстура.
Общий доход по жанрам мультфильмов. Столбчатая диаграмма.
Мне стало интересно, отличается ли картина в жанрах по рейтингу. Поэтому было решено сделать еще одну столбчатую диаграмму («Total Rating by Cartoon Genre»), чтобы потом их сравнить.
Эта столбчатая диаграмма была сделана на основе предыдущей, только заменено название переменной и в groupby Gross поменялся на Rating.
Общий рейтинг по жанрам мультфильмов. Столбчатая диаграмма.
Сравнение двух графиков: жанры по доходу и по рейтингу.
В сравнении видно, что некоторые жанры приносят больше зрительской любви, но меньше денег, и наоборот. Однако это не касается первых двух строчек графика. Значит мне для будущего шедевра надо выбрать либо комедийное приключение, либо боевик. Лучше, конечно, первое — принесёт больше денег и поклонников.
Коробчатая диаграмма и хрон
Далее мне нужно было выяснить, какой хронометраж будет наилучшим. В этот раз я решила смотреть не по деньгам/популярности, а от жанра. Для этого я выбрала коробчатую диаграмму, для которой не надо было что-либо вычислять отдельно.
С этим графиком логика смены цвета фона была понята самостоятельно. Текстура добавлена после в фотошопе.
Распределение хронометража по жанрам. Коробчатая диаграмма.
Хронометраж очень важен в анимации, а потому с ним следует определится и просчитать на начальном этапе производства. И хорошо опереться на жанр и посмотреть по нему. Этот график показывает, что у комедийного приключения широкий диапазон хронометража (начинается с меньше полутора и превышает два часа). У меня большой выбор, но предпочту полтора часа, потому что киношная классика.
Точечная диаграмма и режиссёры
Для этой диаграммы было подсчитано в переменной top_directors, сколько раз имя режиссёра встречается в столбце Director и на основе этого был построен график. Были взяты только первые 10 (с помощью метода head (10)). Текстура сделана в фотошопе.
Топ-10 режиссеров по количеству снятых мультфильмов. Точечная диаграмма.
Этот график показывает, что в топ imdb чаще остальных попадает Хаяо Миядзаки. Значит нужно нарисовать мультфильм в его стиле.
Вывод и блокнот
Проанализировав датасет и построив графики, я примерно поняла, какой мультфильм нужно снять, чтобы добиться любви и богатства. Я узнала возрастной рейтинг, направление сюжета и его жанр, хронометраж и стиль. Сниму комедийное приключение для всей семьи в стили Миядзаки на полтора часа.
Теперь я уж точно не умру под мостом!
Для работы я использовала Chat-GPT и Leonardo.AI.



