
Описание

Арт созданный с помощью Leonardo.
В поисках интересного датасета для анализа я наткнулась на джекпот. Только закончив смотреть «Игру Престолов», я сразу же нашла датасет на Kaggle по битвам из неё! Конечно, стало интересно проанализировать данные, чтобы понять, какие факторы на самом деле влияют на исход сражений в Вестеросе. Для анализа решила использовать гистограмму, столбчатую и круговую диаграммы. Выбрала именно эти типы диаграмм, потому что они очень наглядно показывают зависимости и распределения, плюс это удобно для быстрого понимания данных!

Цветовая палитра.
Для оформления графиков я подобрала палитру, которая, по-моему, просто идеально передаёт атмосферу сурового и реалистичного фэнтези. Оттенки напоминают о камне, земле и металле, прямо как надо.
Цвета: B29b7c, ACA69A, CDC1A9, 594739, 747E65, 515B43
Для текста я выбрала шрифт Cormorant Unicase — он отлично вписывается в фэнтезийную эстетику.
Я загрузила необходимые библиотеки и файлы в формате CSV, чтобы иметь возможность работать с кодом. Затем я перенесла всё в Google Colab и начала анализировать данные. Для анализа был использован файл: battles.csv.
Использование библиотек
В коде используются pandas для обработки данных из battles.csv, matplotlib.pyplot для построения всех графиков, seaborn для их стилизации и matplotlib.rcParams для настройки шрифтов.
Затем я воссоздаю визуальный стиль, который был описан ранее. Выбираю необходимый шрифт и определяю нужные цветовые решения.
Обработка данных
Прежде чем приступить к созданию визуализации, я оцениваю число атакующих домов, анализирую результаты атак и определяю группировки по количеству домов.
Визуализация
На первом графике, который я назвала «Доля побед атакующих в зависимости от количества домов», мне захотелось выяснить, как число домов, объединившихся для атаки, влияет на их шансы на победу. Предполагаю, что чем больше союзников, тем выше вероятность успеха. Проверим на графике.
Доля побед атакующих в зависимости от количества домов.
Оказалось, что да, эта зависимость чётко прослеживается. Когда атакует один дом, доля побед около 85%. А вот если атакует коалиция из двух домов, доля побед вообще доходит до 100%! Однако, при увеличении коалиции до четырёх домов, доля побед резко падает до 50%. Мой вывод: коалиции из двух домов показывают самый высокий процент побед. Одиночные дома тоже неплохо справляются, а вот слишком большие коалиции (от четырёх домов) уже не так эффективны.
Дальше мне стало интересно, кто чаще одерживает верх — атакующие или защитники. На круговом графике «Распределение побед между атакующими и защитниками» хорошо видно общее соотношение побед.
Распределение побед между атакующими и защитниками.
Как оказалось, атакующая сторона («attacker») побеждает в 84,2% случаев, а защищающаяся («defender») — всего в 15,8%. Так что, совершенно однозначно, атакующая сторона побеждает гораздо чаще. Видимо, инициатива и фактор неожиданности дают очень серьёзное преимущество.
Далее я углубилась в данные по атакующим королям, чтобы понять, насколько их кампании были «кровопролитными» — то есть, как часто в их битвах случались смерти или пленения ключевых фигур. На графике «Агрессивность кампаний по атакующим королям» светло-серые полоски показывают среднее количество смертей, светло-коричневые — пленений.
Агрессивность кампаний по атакующим королям.
График показывает, что Станнис Баратеон и Робб Старк лидируют по агрессивности, у них очень высокий показатель смертей. Джоффри/Томмен Баратеон тоже показывают много смертей, но всё же меньше, чем Станнис и Робб. При этом у них почти нет пленений. Балон/Эурон Грейджой — наименее агрессивные, у них почти нет смертей, зато есть пленения. То есть, что Станнис Баратеон и Робб Старк ведут самые смертоносные кампании. Это даёт нам представление об их стиле ведения войны и цене их амбиций.
И в завершение я посмотрела на количество командующих в атакующей стороне и то, как это коррелирует с итоговым победителем. Есть ли разница в числе командиров между победами атакующих и защитников? Обратимся к графику «Распределение числа командующих у атакующей стороны по победившей стороне».
Распределение числа командующих у атакующей стороны по победившей стороне.
Когда у атакующих 1 командующий, они побеждают реже, чем защитники (одна победа атакующих против шести защитников). При 2 командующих у атакующих, они выигрывают чаще (8 побед против 6 у защитников). А вот при 3 и 4 командующих атакующая сторона опять побеждает реже, чем защищающаяся. Так что, можно сказать, что оптимальное количество командующих для атакующих — это два.
Вывод
Изучив датасет битв в Вестеросе, я создала четыре диаграммы, которые помогли мне лучше понять механику сражений во вселенной Джоржа Мартина. Изучив диаграммы, приходим к следующим выводам. Атакующая сторона выигрывает намного чаще, чем защищающаяся. Оптимально, когда у атакующих два командующих. Больше или меньше — результаты хуже. Коалиции из двух домов показывают самый высокий процент побед. Слишком много союзников могут снизить шансы. Некоторые короли, как Станнис и Робб, ведут крайне агрессивные и смертоносные кампании.
Описание применения генеративной модели
Для работы были использованы изображения, сгенерированные в Leonardo, чтобы сделать обложку и проиллюстрировать тему исследования.
Промпт: Make art in the Victor Mosquera style, it should be dedicated to the battle of the bastards, vertical orientation
Ссылка на модель: https://leonardo.ai/
Список источников