Введение
Жанр ужасов занимает особое место в современном кинематографе, привлекая зрителей своей способностью вызывать сильные эмоции — от напряжения и страха до восторга. Фильмы ужасов давно перестали быть нишевым продуктом, превратившись в значимую часть киноиндустрии с многомиллионными бюджетами, культовыми франшизами и преданной базой поклонников.
Для исследования используется датасет с подробной информацией о фильмах ужасов. Данные представлены в формате CSV и включают сотни фильмов, выпущенных за последние десятилетия. Такой набор данных дает возможность изучить взаимосвязь между коммерческими показателями и оценками зрителей, а также проследить динамику выпуска фильмов и изменения популярности жанра по годам.
Выбор данной темы обусловлен моей заинтересованностью в жанре ужасов и его эволюции. Мне интересно изучить, какие факторы делают фильм успешным: высокий бюджет, узнаваемые названия, время выхода или что-то другое. В рамках исследования я планирую выяснить связь коммерческих показателей и оценок зрителей, а также определить ключевые тренды в развитии жанра.
Анализ данных поможет понять динамику кинопроизводства и изменения в восприятии зрителей. Результаты исследования покажут, что делает фильмы ужасов успешными, а также позволят определить главные предпочтения аудитории — какие жанровые сочетания популярны, какие периоды наиболее продуктивны для выпуска, и существует ли связь между бюджетом и итоговым рейтингом.

Генерация в нейросети Ideogram
В рамках проекта я выбрала несколько типов визуализаций:
- Гистограммы — для распределения рейтингов, бюджетов, количества голосов и длительности фильмов, что позволит увидеть общие тенденции и разброс данных.
- Столбчатые диаграммы — для сравнения количества фильмов по годам, топ-10 по рейтингу и популярности, а также для анализа распределения по жанрам и языкам.
- Линейные графики с двумя осями — для анализа динамики выпуска фильмов и изменения среднего рейтинга с течением времени, что отразит развитие жанра.
- Корреляционные тепловые карты — для исследования взаимосвязей между бюджетом, кассовыми сборами, популярностью и рейтингами.
Такой набор графиков обеспечит комплексное и наглядное представление информации, а стилизация визуализаций в тёмной цветовой гамме с акцентами на оттенки крови и тьмы придаст проекту уникальность и целостность, соответствующую эстетике жанра ужасов.
Загрузка и подготовка данных
Для начала я загрузила датасет с хоррор фильмами в формате CSV с помощью Pandas
Для качественного анализа я подготовила данные: из даты релиза извлекла год, чтобы оценить динамику выпуска фильмов, а бюджет и кассовые сборы перевела в числовой формат и миллионы долларов. Это стало основой для корректных сравнений, статистических выводов и наглядных визуализаций, которые позволяют увидеть реальные закономерности в индустрии хорроров
Стилизация
Создавая визуальный стиль для графиков, я хотела, чтобы они не просто показывали цифры, а передавали настроение.
С помощью ChatGPT — DeepSeek я определила ключевые ассоциации с хоррор-фильмами: тьма, кровь, напряжение, мистика. На основе этого я выбрала глубокий чёрный фон, напоминающий бесконечную ночь, акценты в оттенках крови и туманный серый. Тёмно-красный стал основным цветом, так как он ассоциируется с опасностью и визуальной напряжённостью, характерной для жанра. Дополнительные оттенки — приглушённый бордовый и цвет тумана — подчёркивают мрачную, мистическую атмосферу.
Генерация в нейросети Ideogram
Анализ данных
Данный код предназначен для визуализации и статистического анализа четырёх ключевых характеристик фильмов ужасов: рейтинга, популярности, количества голосов и длительности.
Анализ распределений позволяет понять общие закономерности жанра: какие рейтинги считаются нормальными для хорроров, сколько времени зрители готовы уделять таким фильмам, насколько велика аудитория и какие фильмы становятся действительно популярными. Это даёт основу для дальнейшего сравнения успешных и неудачных проектов, а также помогает выявить, какие характеристики влияют на итоговый успех фильма.
На основе визуализации распределения ключевых характеристик фильмов ужасов можно сделать несколько важных наблюдений.
Большинство фильмов жанра сосредоточены в диапазоне рейтинга от 5 до 7 баллов, что говорит о том, что зрители оценивают хорроры достаточно сдержанно — фильмы с оценкой выше 7 встречаются значительно реже. Популярность распределена крайне неравномерно: основная масса фильмов имеет низкие показатели, и лишь небольшое число проектов становятся по-настоящему заметными. Количество голосов также показывает высокую степень дифференциации — у большинства фильмов относительно мало оценок, что может указывать на нишевость жанра или небольшой охват аудитории. Что касается длительности, типичный фильм ужасов длится от 80 до 100 минут, что соответствует устоявшемуся формату жанра, предполагающему динамичное развитие сюжета без затянутости.
Таким образом, полученные распределения подтверждают, что фильмы ужасов — это преимущественно среднебюджетные проекты с умеренными рейтингами, ограниченной, но преданной аудиторией и устоявшимся хронометражем.
Анализ распределения бюджетов и кассовых сборов показывает чёткую картину коммерческой структуры жанра ужасов. Большинство фильмов имеют бюджеты в диапазоне до 20 миллионов долларов, что подтверждает, что хорроры преимущественно остаются средне и малобюджетными проектами. Лишь небольшое количество картин выходят за рамки этого диапазона, представляя собой крупные студийные постановки с бюджетами в десятки миллионов. Распределение кассовых сборов демонстрирует схожую, но более выраженную неравномерность: подавляющее большинство фильмов собирают скромную кассу, не превышающую 50 миллионов долларов. Примечательно, что средний бюджет заметно превышает медиану, что указывает на наличие небольшого числа дорогостоящих фильмов, которые сдвигают среднее значение вверх. Такое распределение подтверждает привлекательность жанра ужасов для кинопроизводителей: относительно невысокий порог входа позволяет экспериментировать и рисковать, а при удачном стечении обстоятельств окупаемость может многократно превысить вложенные средства.
Сравниваем данные
Далее я перехожу к анализу динамики фильмов ужасов во времени. Сначала из даты релиза извлекается год выпуска, что позволяет структурировать данные по временному признаку. Затем строятся две связанные диаграммы: верхняя показывает количество выпущенных фильмов по годам, а нижняя — динамику среднего рейтинга за тот же период.
График количества фильмов позволяет увидеть, как менялась активность кинопроизводства в жанре ужасов: есть ли периоды бума, спады или стабильный рост. Это даёт представление о том, насколько жанр был востребован в разные годы. Второй график — динамика среднего рейтинга — показывает, как менялось качество фильмов с течением времени, помогая понять, совпадают ли периоды высокой производственной активности с ростом или падением оценок зрителей.
Я анализирую эти данные, чтобы выявить взаимосвязь между количеством выпускаемых фильмов и их качеством, а также определить ключевые периоды в развитии жанра. Это позволяет проследить, как менялись предпочтения аудитории и насколько успешно кинематографисты адаптировались к этим изменениям на разных этапах.
Динамика количества фильмов ужасов демонстрирует устойчивый рост на протяжении последних десятилетий, особенно заметный с начала 2000-х годов. Это говорит о растущей популярности жанра и увеличении объёмов производства.
Динамика среднего рейтинга показывает более сложную картину. Несмотря на рост количества фильмов, качество оценок остаётся относительно стабильным, колеблясь в диапазоне от 5 до 7 баллов.
Динамика
Главная особенность следующей визуализации — использование двух осей. Столбчатая диаграмма отображает количество фильмов по годам, позволяя оценить масштабы производства. Линейный график, наложенный поверх столбцов, показывает динамику среднего рейтинга. Такое совмещение даёт возможность наглядно сопоставить два аспекта: как менялось количество фильмов и как при этом менялось их качество.
Я использую этот тип визуализации, чтобы выявить возможные взаимосвязи между объёмами производства и уровнем оценок. Например, можно увидеть, сопровождается ли рост количества фильмов падением рейтингов, или, наоборот, периоды высокой производственной активности совпадают с ростом качества. Это позволяет более глубоко понять эволюцию жанра и ответить на вопрос, как количественные изменения отражаются на зрительском восприятии.
Анализ показывает, как линия рейтинга во многих местах резко уходит вниз или вверх. Такие аномалии могут быть связаны с выходом особенно удачных или провальных картин, которые сдвигают среднегодовое значение. В целом, график подтверждает, что жанр ужасов переживает период активного роста, но качество остаётся стабильным и не зависит напрямую от количества релизов.
Анализ связи
Следующий код выполняет корреляционный анализ, который позволяет выявить статистические взаимосвязи между ключевыми показателями фильмов ужасов: бюджетом, кассовыми сборами, рейтингом, популярностью и количеством голосов. Сначала все выбранные переменные приводятся к числовому формату и масштабируются (бюджет и сборы переводятся в миллионы долларов). Затем из данных удаляются строки с пропусками, чтобы расчёты были корректными, и вычисляется корреляционная матрица — таблица, показывающая степень и направление связи между каждой парой показателей.
Результат визуализируется в виде тепловой карты, где цвет каждой ячейки отражает силу корреляции: красные оттенки указывают на положительную связь (рост одного показателя сопровождается ростом другого), синие — на отрицательную (рост одного ведёт к снижению другого), а близкие к нулю значения говорят об отсутствии значимой зависимости.
Результаты демонстрируют наиболее сильную положительную корреляцию между бюджетом и кассовыми сборами, что логично: чем больше средств вложено в производство, тем выше потенциальная отдача. Однако связь эта не абсолютна — есть фильмы, которые при скромном бюджете собирают внушительную кассу, и наоборот. Также наблюдается заметная корреляция между количеством голосов и популярностью: чем больше зрителей оценивают фильм, тем выше его популярность, что отражает охват аудитории.
Интересно, что рейтинг фильма имеет слабую или умеренную связь с коммерческими показателями. Это означает, что высокие оценки критиков и зрителей не гарантируют больших сборов, и наоборот — кассовый успех может сопровождаться довольно средними рейтингами. Популярность же, напротив, более тесно связана с количеством голосов и кассой, что указывает на её зависимость от масштаба информационного присутствия фильма.
В целом, тепловая карта подтверждает, что в жанре ужасов коммерческий успех и зрительское признание не всегда идут рука об руку. Бюджет остаётся важным, но не единственным фактором успеха, а рейтинг, вопреки ожиданиям, не является надёжным индикатором кассовых сборов.
Вывод
Проведённый анализ фильмов ужасов позволил выявить ключевые закономерности и тенденции, характеризующие современное состояние жанра. На основе комплексного исследования распределений, временной динамики, коммерческих показателей и корреляционных связей можно сделать следующие выводы.
Жанр ужасов демонстрирует устойчивый рост популярности: количество выпускаемых фильмов увеличивается с каждым годом, особенно заметно в последние десятилетия. При этом качество остаётся стабильным — средний рейтинг фильмов колеблется в диапазоне 5–7 баллов и не показывает чёткой зависимости от объёмов производства. Периоды активного выпуска не всегда сопровождаются высокими оценками, что говорит о сохранении жанровых стандартов даже в условиях количественного роста.
Генерация в нейросети Ideogram
Коммерческая структура жанра подтверждает его привлекательность для кинопроизводителей. Большинство фильмов имеют бюджеты до 20 миллионов долларов, что делает порог входа относительно невысоким. При этом кассовые сборы распределены крайне неравномерно: небольшое число проектов становятся настоящими хитами, собирая сотни миллионов, в то время как основная масса фильмов окупается скромно или работает в зоне безубыточности. Такая модель создаёт пространство для экспериментов — даже при ограниченных вложениях существует шанс на коммерческий успех.
Корреляционный анализ показал, что бюджет и кассовые сборы связаны, но не абсолютно: дорогие фильмы чаще окупаются, однако бывают исключения. Наиболее интересным результатом стало отсутствие сильной связи между рейтингом фильма и его коммерческим успехом. Высокие оценки не гарантируют больших сборов, и наоборот — кассовые хиты могут иметь весьма средние рейтинги. Популярность же, напротив, тесно связана с количеством голосов и кассой, что указывает на её зависимость от масштаба охвата аудитории.
Распределения ключевых характеристик показали, что типичный фильм ужасов длится 80–100 минут, получает оценку в районе 6 баллов, имеет скромный бюджет и ограниченную, но преданную аудиторию. При этом существует небольшое количество фильмов-лидеров, которые задают тренды и формируют восприятие жанра.
Таким образом, фильмы ужасов представляют собой динамичный и коммерчески привлекательный сегмент киноиндустрии, сочетающий доступность производства с возможностью многократной окупаемости. Успех в этом жанре зависит не столько от бюджета или рейтинга, сколько от способности попасть в ак
Использование нейросети в работе








