Введение
Для финального проекта по курсу «Программирование для креативных индустрий» я решила проанализировать кассовые сборы фильмов Disney в разные года. Я выбрала именно этот датасет, поскольку он сочетает в себе культурную ценность и количественную выразительность. Фильмы Disney являются важной частью массовой культуры, а их коммерческий успех позволяет проследить, как менялись предпочтения аудитории и масштабы киноиндустрии с течением времени.

Сцена из мультфильма «Леди и бродяга», режиссёры Клайд Джероними, Уилфред Джексон и Гамильтон Ласк, 1955 год.
В рамках данного проекта я работала с платформой Kaggle, на которой и был найден датасет. В наборе данных собрана информация о полном кассовом сборе фильмов студии Disney, включая дату релиза, жанр, название фильма и суммарные сборы. Эти данные представлены в формате CSV, что делает их удобными для анализа с помощью Python и библиотеки Pandas.
Целью проекта стало не просто построение графиков, а осмысленный анализ данных и визуальное объяснение полученных закономерностей.

Сцена из мультфильма «101 далматинец», режиссёры Клайд Джероними, Хэмилтон Ласк и Вольфганг Райтерман, 1961 год.
Визуализация
Графические приемы
Для стилизации визуализаций я задала собственную цветовую палитру и подключила кастомные шрифты напрямую в коде. Источником вдохновения для стилистики стала сказочная и волшебная атмосфера парка развлечений Disneyland.
При работе над композицией я уделяла внимание отступам, иерархии текста и балансу между данными и визуальным воздухом, чтобы графики были не только информативными, но и эстетически цельными.
Этапы работы
С помощью Pandas я преобразовала строковые значения денежных показателей, убрав символы валюты и разделители, после чего перевела их в числовой формат.
import pandas as pd import matplotlib.pyplot as plt import matplotlib.font_manager as fm import numpy as np
df = pd.read_csv («disney_movies_total_gross (1).csv»)
Даты релиза были приведены к формату datetime, что позволило извлечь год и использовать его для анализа динамики во времени. В процессе анализа я активно использовала группировку данных, агрегирование с помощью сумм и средних значений, а также сортировку для выявления лидеров и аутсайдеров.
Графики
Для сравнения жанров по среднему доходу был выбран lollipop chart, так как он сочетает точность и визуальную легкость.
Также в проекте присутствует круговая диаграмма, которая позволяет наглядно оценить доли жанров в общей структуре кассовых сборов.
Для анализа временной динамики я использовала залитый линейный график, который помогает воспринимать рост кассовых сборов как процесс накопления и усиления масштаба.
И горизонтальный столбчатый график был использован для демонстрации самых кассовых фильмов.
Вывод
В проекте используются базовые, но важные статистические методы, такие как расчет суммарных значений, средних арифметических и сравнительный анализ. Эти методы позволили выявить, какие жанры в среднем приносят наибольший доход, как менялся общий кассовый успех студии со временем и какие фильмы стали абсолютными лидерами по сборам. Таким образом, проект демонстрирует изучающий и объясняющий подход к визуализации данных, где каждая диаграмма отвечает на конкретный вопрос и логически дополняет общий рассказ.
Использованные инструменты и генеративные модели
- Чат GPT — исправление ошибок в кодах, анализ графиков
- Google Collab — работа с датасетом, создание графиков



