Original size 3032x3790

анализ данных

PROTECT STATUS: not protected
23

тема проекта. Мне стало интересно посмотреть, какие особенности есть у фильмов и сериалов с самой крупной стриминговой площадки. Возможно, с помощью этого можно предположить причины её популярности.

Про графики: В проекте используются гистограммы, столбчатые диаграммы, круговые диаграммы, линейные графики, а также наложение данных на карту с помощью geopandas. С помощью библиотек matplotlib и seaborn постаралась по возможности стилизовать графики под цветовую палитру Netflix: чёрный фон, красная основная часть и белые элементы. Где приходилось визуализировать множество разных данных, я использовала другие цвета.

Вывод из графиков: на платформе преимущественно представлены фильмы с 2017го года. При этом зарубежные фильмы составляют чуть ли не четверть всего представленного на netflix материала. Самым «большим» дистрибутором фильмов является Индия, сериалов — Великобритания, Япония, Южная Корея. Средняя продолжительность фильмов — 80-110 минут, сериалов — 1 сезон. Половина и более фильмов и сериалов по рейтинге — только для взрослых или с предосторежением для родителей.

big
Original size 1280x637

загрузили датасет, посмотрили, в каком формате хранятся наши данные

big
Original size 1260x1066

посчитали пропуски, убрали основные пропуски из датасета, где их было больше всего. перевели даты в формат date-time, а длительность фильмов и сериалов (duration) — в числовой формат. Также создали из признака listed_in признак genre, где все жанры находятся списком

Original size 1280x842

далее наш первый график — перевернетуая столбчатая диаграмма по жанрам. подсчитываем отдельно все жанры с помощью библиотеки Counter и выбираем 10 самых частых. На оснований их названий и их частоты мы и создаём график. Мы видим, что больше всего международных фильмов, однако не сильно меньше на Нетфликсе драм

Original size 1280x1087

далее построила график, визуализирующий распределение фильмов и сериалов на netflix по годам их выхода. построила для этого отдельно гистограммы по ним, а также общий для них линейный график. На нём мы видим, что фильмов на Netflix практически в два раза больше, однако количество сериалов также растёт

Original size 1280x856

после — круговая диаграмма распределения фильмов и сериалом по возрастным категориям. Цвета выбирались вручную для соответствия стилистике платформы. Вывод по визуализации: большинство фильмов и сериалов имеют категорию, запрещающие просмтр подросткам или рекомендованные для росмотра с предостережением родителей

Original size 1280x925

далее построила диаграмму распределения фильмов и сериалов по странам их производства. для этого была использована библиотека geopandas, с помощью который наложил на карту, в котороой закодированы различные названия стран, на данные из датасета. В коде карты США называлась по другому, чем в датасете, и пришлось переименовать их. По диаграмме видно, что большая часть фильмов и сериалов снята в США, на втором месте Индия (вероятно, благодаря Боливу), тогда как лидеры по сериалам, после США: Англия, Япония и Южная Корея (благодаря росту популярности дорам). Хоть фильмы/сериалы из США и доминируют на Netflix, также заметна международная направленность платформы

Original size 1280x574
Original size 1280x1005

финальный график — распределение времени фильмов и сериалом. Для этого были построены классические гистограммы на основании измененного в начале признака duration.Видно, что средняя продолжительность фильмов — от 90 до 110 минут, а среди сериалов преобладающее большинстве имеет лишь один сезон. Можно сказать, что Netflix ориентирован на короткие сериалы и средней длины фильмы

Итоговый вывод по всем данным: можно сказать, что основными характеристиками фильмов и сериалов на Netflix является их небольшой по длительности формат, международность и ориентированность на взрослую аудиторию, что так же видно по жанрам (второй по пулярности жанр — драма). К тому же важным фактором является то, что доминирующая доля фильмов и сериалов на Netflix — современные, т. е. платформа не является сборником архивных произведений, а старается выпускать современные работы.

анализ данных
23
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more