Исходный размер 373x540

Визуализация и анализ данных IMDB Top 1000

Описание

С сайта Kaggle я скачала датасет, содержащий топ 1000 фильмов IMDB за все время с некоторыми характеристиками, такими как жанры фильма, год выпуска, его рейтинг, его бюджет и так далее. Мне было интересно взять для анализа что-то связанное с кино, потому что я слежу за развитием этой индустрии, а также много его смотрю. Мною были проанализированы в основном характеристики, связанные с жанрами фильмов, были построены следующие графики: — линейные; — столбчатые; — круговая диаграмма. Эти типы графиков лучше всего подходили для решения нужных мне задач. В качестве основы для оформления я брала цветовую палитру Pyton Set3, все цвета были взяты из нее. Я постаралась визуализировать не слишком нагроможденные и удобные для понимания графики.

Анализ и визуализация

Изначально мне хотелось узнать самые часто встречающиеся жанры среди тысячи лучших фильмов, поэтому я построила столбчатый график, оставив на нем только 5  самых популярных жанров.

Исходный размер 2705x909

Код 1

Исходный размер 989x590

Получившийся график

На графике наглядно видно, что фильмов с жанром «Drama» больше всего. Меня заинтересовал жанр комедии, и я захотела посмотреть, как менялось количество лучших фильмов этого жанра по годам.

Исходный размер 2717x1065

Код 2

Исходный размер 630x470

График 2

После этого я решила сравнить получившийся результат с самым популярным жанром — драмой. Для этого на предыдущий график я добавила еще одну кривую, а также легенду, чтобы различить жанры.

Исходный размер 2700x557

Код 3

Исходный размер 630x470

График 3

После этого мне стало интересно, как жанры соотносятся с рейтингом фильма. Так как в датасете собраны лучшие фильмы, то и рейтинг у всех них был высокий, поэтому я решила определить соотношение жанров, получивших оценку больше 8.5. Итак, я построила круговую диаграмму, показывающее распределение фильмов, имеющих рейтинг более 8.5, по жанрам.

Исходный размер 2706x893

Код 4

Исходный размер 794x658

График 4

Я предполагала, что наиболее популярный жанр — драма — и будет получать наивысшие оценки, однако оказалось, что жанр «Western» имеет более высокий процент рейтинга больше 8.5. Возможно, это связано с количеством фильмов этих жанров, несмотря на то, что я считала долю именно в процентах.

Описание применения генеративной модели

В работе я иногда пользовалась ChatGPT для правильного синтаксиса при написании кода. Я указывала в промпте четкие указания пошагово, с помощью этого получая четкий и решающий мою задачу результат.

Промпты

Также при помощи Bing Copilot GPT была сгенерирована обложка для данного проекта.

Исходный размер 1939x705

Промпт

Визуализация и анализ данных IMDB Top 1000
Проект создан 25.09.2024
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше