
тема проекта. Мне стало интересно посмотреть, какие особенности есть у фильмов и сериалов с самой крупной стриминговой площадки. Возможно, с помощью этого можно предположить причины её популярности.
Про графики: В проекте используются гистограммы, столбчатые диаграммы, круговые диаграммы, линейные графики, а также наложение данных на карту с помощью geopandas. С помощью библиотек matplotlib и seaborn постаралась по возможности стилизовать графики под цветовую палитру Netflix: чёрный фон, красная основная часть и белые элементы. Где приходилось визуализировать множество разных данных, я использовала другие цвета.
Вывод из графиков: на платформе преимущественно представлены фильмы с 2017го года. При этом зарубежные фильмы составляют чуть ли не четверть всего представленного на netflix материала. Самым «большим» дистрибутором фильмов является Индия, сериалов — Великобритания, Япония, Южная Корея. Средняя продолжительность фильмов — 80-110 минут, сериалов — 1 сезон. Половина и более фильмов и сериалов по рейтинге — только для взрослых или с предосторежением для родителей.

загрузили датасет, посмотрили, в каком формате хранятся наши данные

посчитали пропуски, убрали основные пропуски из датасета, где их было больше всего. перевели даты в формат date-time, а длительность фильмов и сериалов (duration) — в числовой формат. Также создали из признака listed_in признак genre, где все жанры находятся списком
далее наш первый график — перевернетуая столбчатая диаграмма по жанрам. подсчитываем отдельно все жанры с помощью библиотеки Counter и выбираем 10 самых частых. На оснований их названий и их частоты мы и создаём график. Мы видим, что больше всего международных фильмов, однако не сильно меньше на Нетфликсе драм
далее построила график, визуализирующий распределение фильмов и сериалов на netflix по годам их выхода. построила для этого отдельно гистограммы по ним, а также общий для них линейный график. На нём мы видим, что фильмов на Netflix практически в два раза больше, однако количество сериалов также растёт
после — круговая диаграмма распределения фильмов и сериалом по возрастным категориям. Цвета выбирались вручную для соответствия стилистике платформы. Вывод по визуализации: большинство фильмов и сериалов имеют категорию, запрещающие просмтр подросткам или рекомендованные для росмотра с предостережением родителей
далее построила диаграмму распределения фильмов и сериалов по странам их производства. для этого была использована библиотека geopandas, с помощью который наложил на карту, в котороой закодированы различные названия стран, на данные из датасета. В коде карты США называлась по другому, чем в датасете, и пришлось переименовать их. По диаграмме видно, что большая часть фильмов и сериалов снята в США, на втором месте Индия (вероятно, благодаря Боливу), тогда как лидеры по сериалам, после США: Англия, Япония и Южная Корея (благодаря росту популярности дорам). Хоть фильмы/сериалы из США и доминируют на Netflix, также заметна международная направленность платформы
финальный график — распределение времени фильмов и сериалом. Для этого были построены классические гистограммы на основании измененного в начале признака duration.Видно, что средняя продолжительность фильмов — от 90 до 110 минут, а среди сериалов преобладающее большинстве имеет лишь один сезон. Можно сказать, что Netflix ориентирован на короткие сериалы и средней длины фильмы
Итоговый вывод по всем данным: можно сказать, что основными характеристиками фильмов и сериалов на Netflix является их небольшой по длительности формат, международность и ориентированность на взрослую аудиторию, что так же видно по жанрам (второй по пулярности жанр — драма). К тому же важным фактором является то, что доминирующая доля фильмов и сериалов на Netflix — современные, т. е. платформа не является сборником архивных произведений, а старается выпускать современные работы.