
О проекте
В этом проекте я анализирую огромный набор данных из Steam (https://steamcommunity.com) — самого популярного в мире онлайн-магазина компьютерных игр. Датасет содержит информацию о тысячах игр: даты выхода, цены, жанры, оценки критиков и поддерживаемые платформы.
Я выбрала Steam для анализа, потому что сама очень люблю играть и мне было интересно разобраться, как устроена моя любимая индустрия изнутри. В своем проекте я проанализировала данные из Steam, чтобы увидеть, как меняются тренды, какие жанры сейчас в топе и могут ли маленькие инди-проекты конкурировать с гигантами.
Для данного проекта был использован набор данных с сайта Kaggle: (https://www.kaggle.com/datasets/fronkongames/steam-games-dataset).
Описание применения генеративной модели
При создании проекта я обращалась к Gemini (https://gemini.google.com/app), чтобы понять, как совершать те или иные операции и как правильно написать код, чтобы всё работало. Также ИИ помог мне провести исследовательский анализ данных (EDA) по играм из Steam на языке Python.
Использованные промты: (https://pastebin.com/T9ms7jvJ)
Обложка для проекта была сгенерирована с помощью ChatGPT (https://chatgpt.com/) по промту:
«Vertical cover illustration for a student project about video game market analysis and data visualization (Steam). Dark navy blue background
Визуальное оформление проекта
Выбор цветовой палитры обусловлен спецификой предметной области и требованиями к визуализации данных. В основу легла эстетика киберпанка и ретровейва, что создает прямую ассоциативную связь с гейм-индустрией, цифровыми технологиями и платформой Steam. Выбранная палитра цветов не только подчеркивает современность и креативный характер индустрии, но и повышает читаемость сложных аналитических данных.
Шрифт: DejaVu Sans
Визуализация данных
График иллюстрирует ежегодное количество релизов в Steam в период с 2008 по 2024 год. До 2012 года количество новых игр оставалось минимальным из-за жесткого отбора и закрытости платформы. Однако ситуация кардинально изменилась после того, как компания Valve запустила программы Steam Greenlight, а затем Steam Direct. Эти инициативы упростили доступ к магазину для независимых разработчиков, что привело к экспоненциальному росту числа релизов: если в начале пути счет шел на сотни, то к 2024 году этот показатель превысил отметку в 20 000 игр в год.
График демонстрирует классический экспоненциальный рост индустрии, вызванный сменой политики Steam. До 2012 года Valve отбирала проекты вручную, что сдерживало развитие рынка, однако запуск систем Greenlight и Direct в 2013–2014 годах полностью снял эти барьеры. Упрощение публикации привело к «взрыву» контента: сегодня за один год выходит больше игр, чем за всё первое десятилетие работы платформы. Из-за такой колоссальной динамики данные удобнее отображать на логарифмической шкале — линейный характер графика в этом формате математически подтверждает гипотезу об экспоненциальном взрыве количества выпущенных игр.
Самые популярные жанры
Поскольку у одной игры может быть сразу несколько жанров, для анализа я разбила их на отдельные категории и определила самые популярные. Основное внимание уделяется инди-проектам (независимая разработка с ограниченным бюджетом), экшенам (динамичный геймплей на скорость реакции) и приключениям (игры, ориентированные на сюжет и изучение игрового мира).
В жанровой структуре лидирует инди-сегмент, что подтверждает прямую связь между доступностью платформы и «взрывным» ростом числа релизов за счет независимых студий. Вторую и третью позиции занимают казуальные игры и экшены — их лидерство обусловлено универсальностью механик и ориентацией на массового потребителя. В то же время стратегии и RPG представляют меньшую долю рынка, что объясняется их высокой ресурсоемкостью, сложностью разработки и более узким кругом целевой аудитории.
Распределение цен: Инди против Крупных студий
Игры принято делить по масштабу производства на две основные группы: Indie (независимые проекты, созданные небольшими коллективами или отдельными авторами при минимальных затратах) и Non-Indie (высокобюджетные проекты класса AAA, сопоставимые по уровню инвестиций с киноблокбастерами).
Для сравнительного анализа стоимости этих категорий я использую график Violin Plot («скрипичная диаграмма»). Этот метод визуализации позволяет не только зафиксировать среднее значение цены (отмеченное белой линией), но и оценить плотность распределения данных: «ширина» фигуры наглядно демонстрирует, в каких ценовых диапазонах сосредоточено наибольшее количество проектов.
График наглядно показывает расслоение рынка на два ценовых лагеря. Инди-игры в основном стоят от 5 до 15 долларов — на «скрипке» это видно по самому широкому розовому участку внизу. В этой зоне огромная конкуренция, и разработчики стараются держать цены низкими. У крупных студий ситуация иная: их график вытянут вверх, и заметны четкие пики на отметках 40 и 60 долларов. Это классические ценники для больших хитов, и видно, что такие компании могут позволить себе ставить высокую планку. Если сравнить средние цены (белые линии), то у инди-разработчиков они почти в два раза ниже. Это логично, ведь затраты несопоставимы: большие компании тратят миллионы на офисы, огромный штат и рекламу, тогда как одиночки или маленькие команды часто делают игры в свободное время как хобби. Также интересно, что на графике видны «всплески» именно на круглых суммах вроде 5, 10 или 20 долларов — издатели явно предпочитают такие психологически понятные ценники.
Этот график наглядно подчеркивает огромную диспропорцию на рынке. В категории до 10 долларов мы видим настоящий «океан» игр: голубой цвет на первом столбце просто перекрывает всё остальное, так как независимые разработчики массово выпускают бюджетные проекты. На этом фоне крупные игры (розовые сегменты) выглядят буквально как капля в море, особенно в дешевом сегменте. В итоге получается интересная ситуация: для игрока с небольшим бюджетом выбор кажется бесконечным, а вот количество по-настоящему крупных блокбастеров на рынке на самом деле очень ограничено.
Платим ли мы за качество?
Этот график разрушает популярный миф о том, что дорогая игра — значит хорошая. Линия тренда здесь почти горизонтальная, а это говорит о том, что цена проекта практически не влияет на его итоговый рейтинг. На графике полно примеров, когда копеечные инди-игры получают оценки 90+, становясь настоящими шедеврами, и наоборот — дорогущие блокбастеры за $60 с треском проваливаются. При этом у дешевых игр разброс оценок гораздо сильнее: среди них много как скрытых алмазов, так и откровенно слабых проектов, которые и выпускают по низкой цене. Также хорошо заметно, как цены группируются вокруг «круглых» сумм — $5, $10, $20. Это чистый маркетинг, ведь игрокам психологически проще воспринимать такие ценники.
Итог: Высокий бюджет и высокая цена не гарантируют, что игра понравится людям.
Поддержка Mac и Linux
Раньше игры выпускали в основном только под Windows, но постепенно ситуация начала меняться. Хотя компьютеры Apple очень популярны для работы, они остаются довольно сложной платформой для гейминга. В то же время Linux, свободная операционная система, в последние годы стала заметно востребованнее у игроков. Большую роль в этом сыграла портативная консоль Steam Deck от Valve, которая работает как раз на базе Linux. Ниже на графике можно увидеть, какая доля игр сегодня поддерживает каждую из этих систем.
Mac и Linux — умирают?
На предыдущем графике мы видели, что доля игр с поддержкой Linux и macOS падает с 2017 года. Можно подумать, что разработчики перестали делать игры для этих систем.
Чтобы проверить это, я построила график абсолютного количества игр (в штуках), выходящих на Mac и Linux каждый год. Потом использовала логарифмическую шкалу, чтобы увидеть динамику роста.
Гипотеза: Игр на Linux не стало меньше. Просто игр «только для Windows» стало выходить настолько много, что доля Linux размылась.
Этот график полностью подтверждает мою теорию: количество игр для Linux и macOS вовсе не падает. Наоборот, если посмотреть на розовую и зеленую линии, видно, что до 2018 года шел стремительный рост, а сейчас показатели остаются стабильно высокими — это тысячи новых проектов ежегодно. Причина падения процентов на самом деле в простой математике: хотя игр на Linux стало больше в 10 раз, рынок Windows за то же время вырос в 50 раз. В итоге доля альтернативных систем на общем фоне визуально сократилась, хотя самаэкосистема продолжает активно развиваться. Разработчики не бросили эти платформы — просто сегмент Windows растет гораздо более агрессивными темпами.
Блокнот с кодом и датасетом
Список материалов и нейросетей