Исходный размер 2400x3369

Анализ и визуализация контента платформы Netflix

PROTECT STATUS: not protected

В данном проекте я исследую данные Netflix о фильмах и сериалах, взятые из датасета с сайта Kaggle, netflix_titles.csv.

База данных Netflix (netflix_titles.csv) Содержит информацию о фильмах и сериалах: тип (Movie / TV Show) год выпуска страна рейтинг

big
Исходный размер 1600x1282

Для визуализации данных были выбраны несколько типов графиков: линейный график, столбчатая диаграмма, гистограмма и круговая диаграмма. Линейный график использовался для отображения изменения количества контента по годам, столбчатая диаграмма — для сравнения фильмов и сериалов, гистограмма — для анализа распределения возрастных рейтингов, а круговая диаграмма — для наглядного представления стран с наибольшим количеством контента.

Работа с данными началась с их загрузки с помощью библиотеки pandas. После этого были выбраны только необходимые столбцы, содержащие ключевую информацию для анализа: тип контента, год выпуска, страна, возрастной рейтинг и длительность.

После очистки данных были удалены пропущенные значения, а также проведено преобразование некоторых признаков (например, извлечение числового значения длительности из текстового формата). Далее данные были сгруппированы по годам для анализа динамики выпуска контента, а также подсчитано количество значений для различных категорий.

Загрузка данных

Исходный размер 1302x833

Создание единого стиля

Исходный размер 1250x185

Обработка данных и построение графиков

Линейный график

Исходный размер 1250x491
Исходный размер 1232x600

Столбчатая диаграмма

Исходный размер 1249x388
Исходный размер 1244x424

Гистограмма

Исходный размер 1251x335
Исходный размер 1239x567

Круговая диаграмма

Исходный размер 1109x759

Заключение

Анализ показал, что количество контента на платформе значительно увеличивается с течением времени, особенно в последние годы. При этом фильмы составляют большую часть библиотеки по сравнению с сериалами. Большинство контента ориентировано на широкую аудиторию, что отражается в распределении возрастных рейтингов. Также наблюдается концентрация производства контента в нескольких странах, среди которых лидирующую позицию занимают США.

Использование визуализации позволило упростить восприятие информации и сделать анализ более наглядным. Применение различных типов графиков дало возможность рассмотреть данные с разных сторон и выявить основные закономерности.

Анализ длительности показал, что большинство фильмов соответствует стандартному временному диапазону, принятому в индустрии, что говорит о следовании общим производственным практикам.

В процессе выполнения проекта использовалась нейросеть ChatGPT в качестве вспомогательного средства: для уточнения синтаксиса кода и улучшения визуализации графиков.

Анализ и визуализация контента платформы Netflix
Проект создан 22.03.2026
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше