Original size 1140x1600

Анализ баскетбольной команды Denver Nuggets

PROTECT STATUS: not protected
7

Выбор темы

В качестве темы для финального проекта по курсу «‎Программирование для креативных индустрий» я выбрала базу данных баскетбольной команды Denver Nuggets, так как с детства увлекалась баскетболом и мне стало интересно, существует ли статистика такого вида спорта. Как же я была удивлена, когда узнала, что есть целые платформы с исчерпывающими ресурсами отдельных баскетбольных команд NBA. Мне показалось интересным посмотреть и проанализировать датасеты моей любимой баскетбольной команды.

*NBA — National Basketball Association (Национальная Баскетбольная Ассоциация)

0

Denver Nuggets, матч NBA

Статистические данные я брала с открытого источника basketball-reference.com.

*Basketball-reference — это огромная база данных по всей лиге NBA и ABA, где можно найти огромное количество таблиц, словарей и списки всех игроков, их соотношение и ставки, которые были поставлены на определенную игру или конкретного игрока. В этом источнике хранится более десятка тысяч различных больших данных.

В ходе анализа датасетов я посчитала подходящими следующие виды графиков, поскольку нашла их наиболее релевантными и наглядными для визуализации данных:

— Круговая диаграмма — Комбинированный график — Диаграмма размаха — Гистограмма — Множественный линейный график

Этапы работы

Original size 2500x1163

Цвета (слева направо): #1777b6, #f57e20, #d72829, #2aa149

Свое цветовое решение я решила не останавливать на цветах эмблемы баскетбольной команды, как я планировала изначально, так как посчитала, что графики можно сделать ярче. Поэтому немного видоизменила цвета, изменив оттенок синий на более светлый и ярко-желтый на приглушенный. Красный я сделала немного светлее и в качестве яркого акцента добавила еще ярко-салатовый цвет.

P. S. — фоновый цвет своего проекта я выбрала синим, как и форма команды. (#223f99)

Обложка

Для создания обложки я использовала нейросеть Midjourney. Моими главными критериями было сохранение цветовой гаммы и ассоциативный ряд, связанный с баскетболом. Лично у меня это граффити из начала нулевых.

Promt: — draw a vector image that should show the basketball match in a full swing. The view should be from above. The image should be done in the style of 2000s graffiti and contain light orange, green and blue elements

Original size 2523x1181

Варианты обложек, созданных нейросетью Midjourney

1. Круговая диаграмма

Первой мне на глаза попалась статистика игроков в зависимости от их страны рождения. NBA — профессиональная лига Северной Америки, в основном США и Канады, поэтому до углубления в тему я была уверена, что большинство игроков — американцы и канадцы. Однако, как оказалось, в Denver Nuggets есть и игроки из Сербии и даже Хорватии!

Original size 1796x977

Круговая диаграмма, демонстрирующая соотношение игроков в команде Denver Nuggets в зависимости от страны рождения

0

Код для создания диаграммы

2. Комбинированный график

Original size 1613x768

Комбинированный график, показывающий стоимость каждого игрока из баскетбольной команды Denver Nuggets, основываясь на проценте точных бросков каждого игрока и его (игрока) эффективности

Выглядит сложно. Я тоже не знала до этого, как рассчитывается стоимость игрока и что она вообще существует. Комбинированный график определяет стоимость игрока, основываясь на его бросках и проценте их точности. Как видно из графика, игрок с самым низким рейтингом — Трей Александр. Процент точности его бросков равняется нулю, соответственно, у него самая низкая стоимость. Никола Йокич же занимает лидирующую позицию, у него самый высокий рейтинг и самые точные броски.

Original size 1480x833

Никола Йокич

0

Код для создания комбинированного графика

P. S. — стоимость игрока в баскетболе, как и в любом другом виде профессионального спорта — очень важная составляющая. Клубы используют такую статистику для предложения выгодного контракта. Также такие графики помогают клубам и инвесторам грамотно вложить свои деньги в потенциально успешного новичка, ориентируясь на его первые игры или в опытного игрока, который хорошо/плохо отыграл последний сезон.

Клубы так же оценивают рейтинг игрока и его броски для прогноза будущих игр, рассматривая варианты возможных травм, потенциал роста, возраст и то, как он может повлиять на перечисленные выше показатели.

3. Диаграмма размаха

Третья диаграмма самая сложная в исполнении и понимании. Диаграмма размаха или «ящик с усами» — это тип графика, который отображает распределение набора данных, показывая его минимальное значение, первый квартиль (Q1), медиану (Q2), третий квартиль (Q3) и максимальное значение. Она особенно полезна для сравнения распределений между несколькими наборами данных или группами.

Как читать диаграмму размаха?

Центральная тенденция: Медиана показывает «центр» данных. Сравнение медиан разных диаграмм размаха позволяет быстро оценить, какие наборы данных имеют в среднем более высокие или низкие значения.

Размах (Дисперсия): Длина ящика (IQR) и длина «усов» показывают, насколько данные разбросаны. Короткий ящик и короткие усы указывают на небольшую дисперсию, длинный ящик и длинные усы — на большую.

Симметрия: Если медиана находится посередине ящика, а усы примерно одинаковой длины, это говорит о симметричном распределении данных. Смещенное положение медианы или разная длина усов указывают на асимметрию.

Выбросы: Наличие большого количества выбросов может указывать на проблемы с данными или на то, что распределение имеет «тяжелые хвосты».

Original size 1482x738

Диаграмма размаха, демонстрирующая характеристику игр с 1986 по 2025 год

PTS — Points Per Game (очки за каждую игру) PF — Personal Fouls Per Game (фолы/ штрафы каждого игрока за каждую игру) BLK — Blocks Per Game (количество блоков за каждую игру) AST — Assists Per Game (количество передач игроку за каждую игру) 2P — 2 Point Field Goals Per Game (количество забитых лэй-ап/двухочковых бросков за каждую игру) 3P — 3 Point Field Goals Per Game (количество забитых трехочковых бросков за каждую игру) MP — Minutes Played Per Game (минуты каждой игры)

0

Код диаграммы размаха

Как уже я говорила ранее, длина ящика и длина «усов» показывают, насколько данные разбросаны. Короткий ящик и короткие усы указывают на небольшую дисперсию, длинный ящик и длинные усы — на большую. Так, на графике видно, что больше всего изменений или самую большую дисперсию показывают трехочковые броски, а меньше всего дисперсии терпит количество минут в игре, так как за весь этот временной промежуток (с 1986 по 2025) стандартное время одной игры не менялось. Большое количество выбросов (кругов за пределами усов) в колонке трехочковых бросков указывают на аномальные изменения или сложность в статистике. Блоки имеют среднее значение, т. е. в пределах нормы и соответствует ожиданиям.

Original size 1024x683

Блок-шот

4. Гистограмма и множественный линейный график

Original size 1422x717

Гистограмма и множественный линейный график

Следующие два графика показывают изменения в нескольких критериях (возраст, рост и вес) в баскетбольной команде Denver Nuggets в период с 1986 года по 2025 год по процентному соотношению и соотношению в годах.

0

Код графиков

Любопытно, что на втором графике виден сильный скачок в 2000-м году по возрасту. Мне стало интересно, чем обусловлен такой резкий скачок и в какую сторону были изменения возраста. В 2000-м году в баскетбольные команды стали массово набираться новички, а точнее молодежь, мечтавшая играть в NBA. Как раз именно на 2000–2005 год приходится расцвет и популярность NBA и баскетбола в целом.

Заключение

Такие датасеты и обширные открытые источники данных помогли мне понять лучше структуру баскетбола и что даже такой динамичный и, казалось бы, хаотичный вид спорта можно структурировать.

В процессе изучения датасета, содержащего информацию о всего лишь одной команде лиги NBA я смогла узнать какие-то любопытные факты, которые для меня могут быть и не сильно применимыми с практической точки зрения, но очень интересными для изучения.

Описание применения генеративной модели

— Midjourney Создание обложки для итогового проекта. (см. экраны 12)

— Chat GPT Помощь в правильной генерации кода, создании библиотек и массивов, применимых в коде для создания графиков (см. экраны 16, 17, 21, 22, 28, 29, 33, 34)

Original size 2500x1163
Анализ баскетбольной команды Denver Nuggets
7
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more