В данном проекте я исследую данные Netflix о фильмах и сериалах, взятые из датасета с сайта Kaggle, netflix_titles.csv.
База данных Netflix (netflix_titles.csv) Содержит информацию о фильмах и сериалах: тип (Movie / TV Show) год выпуска страна рейтинг

Для визуализации данных были выбраны несколько типов графиков: линейный график, столбчатая диаграмма, гистограмма и круговая диаграмма. Линейный график использовался для отображения изменения количества контента по годам, столбчатая диаграмма — для сравнения фильмов и сериалов, гистограмма — для анализа распределения возрастных рейтингов, а круговая диаграмма — для наглядного представления стран с наибольшим количеством контента.
Работа с данными началась с их загрузки с помощью библиотеки pandas. После этого были выбраны только необходимые столбцы, содержащие ключевую информацию для анализа: тип контента, год выпуска, страна, возрастной рейтинг и длительность.
После очистки данных были удалены пропущенные значения, а также проведено преобразование некоторых признаков (например, извлечение числового значения длительности из текстового формата). Далее данные были сгруппированы по годам для анализа динамики выпуска контента, а также подсчитано количество значений для различных категорий.
Загрузка данных
Создание единого стиля
Обработка данных и построение графиков
Линейный график
Столбчатая диаграмма
Гистограмма
Круговая диаграмма
Заключение
Анализ показал, что количество контента на платформе значительно увеличивается с течением времени, особенно в последние годы. При этом фильмы составляют большую часть библиотеки по сравнению с сериалами. Большинство контента ориентировано на широкую аудиторию, что отражается в распределении возрастных рейтингов. Также наблюдается концентрация производства контента в нескольких странах, среди которых лидирующую позицию занимают США.
Использование визуализации позволило упростить восприятие информации и сделать анализ более наглядным. Применение различных типов графиков дало возможность рассмотреть данные с разных сторон и выявить основные закономерности.
Анализ длительности показал, что большинство фильмов соответствует стандартному временному диапазону, принятому в индустрии, что говорит о следовании общим производственным практикам.
В процессе выполнения проекта использовалась нейросеть ChatGPT в качестве вспомогательного средства: для уточнения синтаксиса кода и улучшения визуализации графиков.



