Original size 832x1167

Баланс возможностей: гендерное равенство в данных

PROTECT STATUS: not protected
The project is taking part in the competition

Концепция

Данный проект посвящён анализу глобального гендерного неравенства на основе официальных международных статистических данных. В фокусе исследования — динамика и различия в положении женщин в разных странах мира на протяжении более чем шестидесяти лет, с 1960 по 2024 год.

Гендерное равенство сегодня рассматривается не только как вопрос социальной справедливости, но и как ключевой индикатор устойчивого экономического и социального развития. Уровень участия женщин в экономике, доступ к образованию, правам и политическому представительству напрямую связан с благосостоянием стран, качеством институтов и возможностями для будущих поколений.

Выбор данных и источник

Для анализа был использован датасет «Global Gender Equality Indicators», скачанный с платформы Kaggle и основанный на данных Всемирного банка. Датасет охватывает более 200 стран и период с 1960 по 2024 год.

В работе используются ключевые поля: название страны, год, индикатор и его числовое значение. Выбор этих данных обусловлен их глобальным охватом и большой временной глубиной, что позволяет анализировать долгосрочные изменения гендерного неравенства и сравнивать динамику между странами.

Изначально датасет включает агрегированные региональные показатели и группы стран по уровню дохода. Для корректного анализа такие агрегаты были удалены, и в итоговой визуализации используются только данные по отдельным странам.

Выбранные типы визуализаций и их обоснование

big
Original size 1248x832

Линейный график — Для анализа временных трендов были выбраны индикаторы участия мужчин и женщин в рабочей силе. С помощью группировки данных по годам и усреднения значений был рассчитан глобальный средний уровень участия для мужчин и женщин. Каждая линия отражает изменение показателя во времени для соответствующего пола.

Диаграмма рассеяния — Для исследования взаимосвязи между уровнем образования женщин и их участием в рабочей силе была использована диаграмма рассеяния. Каждая точка на графике представляет отдельный год, а координаты точек соответствуют значениям выбранных показателей.

Круговая диаграмма — Для оценки того, улучшилась ли ситуация с гендерным равенством, был рассчитан гендерный разрыв как разница между участием мужчин и женщин в рабочей силе. Данные были агрегированы по двум временным периодам (начальный и конечный), после чего для каждой страны была вычислена разница между средними значениями разрыва. В зависимости от направления изменений страны были классифицированы на три группы.

Столбчатые диаграммы — Для более детального сравнения стран был создан нормализованный индекс гендерного равенства, основанный на абсолютной величине гендерного разрыва. Значения индекса были усреднены по времени для каждой страны. На основании полученного индекса были определены десять стран с наивысшим и десять стран с наименьшим уровнем гендерного равенства.

Тепловая карта корреляций — Для анализа взаимосвязей между числовыми переменными была построена тепловая карта корреляций. Сначала из датасета были отобраны числовые столбцы, соответствующие значениям показателей по годам, после чего была рассчитана матрица корреляций с использованием коэффициента Пирсона.

Визуальное оформление

Original size 1248x832

Промпт Leonardo AI: «Abstract modern cover illustration for a presentation. Create a composition of 3 geometric squares in line in red, blue, and yellow. Clean, minimalistic, professional design wi»

Визуальная айдентика проекта построена вокруг идеи аналитической нейтральности и исследовательской объективности. Поскольку тема гендерного равенства связана с социально чувствительными и политически значимыми вопросами, в оформлении сознательно избегаются эмоционально нагруженные визуальные приёмы и стереотипные цветовые ассоциации. Основная задача визуального языка проекта — не интерпретировать данные за зрителя, а создать ясную и спокойную среду для их осмысленного анализа.

Цветовая палитра проекта основана на ярких, но сдержанных базовых цветах. В качестве основного цвета используется глубокий синий тон, ассоциирующийся с надёжностью и объективностью данных. Этот цвет применяется в ключевых графических элементах: линиях временных рядов, основных столбцах и маркерах. Акцентный цвет — насыщенный красный, используется точечно для выделения важных показателей, ключевых стран или значимых лет. В качестве дополнительного цветового акцента применён яркий жёлтый, который используется для подчёркивания особых аналитических выводов или заметных деталей. Фоновым цветом выбран светлый нейтральный тон, который снижает визуальную нагрузку и делает графики комфортными для длительного просмотра, а для текста, осей и вспомогательных элементов используется тёмный графитовый цвет, обеспечивающий высокий контраст и хорошую читаемость

Загрузка данных

Для работы я импортировала библиотеки: pandas для обработки табличных данных, numpy для числовых вычислений, matplotlib.pyplot и seaborn для построения графиков. Также использовались модули matplotlib.cm для цветовых карт, rcParams и font_manager для настройки стиля графиков, а os — для работы с файлами и папками.

ЗАГРУЗКА БИБЛИОТЕК И ДАННЫХ

import os import pandas as pd import matplotlib.pyplot as plt from matplotlib import rcParams from matplotlib import font_manager as fm import matplotlib.cm as cm import numpy as np import seaborn as sns

Линейный график

На первом этапе анализа рассматривается разрыв между женщинами и мужчинами по уровню участия в рабочей силе. Для этого используются линейные графики, отображающие средние мировые значения показателя по годам. Такой формат позволяет наглядно проследить динамику гендерного разрыва во времени и оценить, сокращается ли различие между женщинами и мужчинами на глобальном уровне, а также выявить периоды ускоренного или замедленного прогресса.

Original size 990x543
Original size 1816x884

В коде выделяются данные по участию в рабочей силе для женщин и мужчин из общего датафрейма df_long. Затем для каждого пола считается среднее значение по годам. На основе этих данных строится линейный график с годами на оси X и процентом участия в рабочей силе на оси Y, где кривые для женщин и мужчин окрашены в заданные цвета, добавлены подписи и легенда.

Диаграмма рассеяния

Original size 1376x787

Диаграмма рассеяния показывает, что существует положительная связь между долей женщин с средним образованием и их участием в рабочей силе: в странах с более высоким уровнем образования женщин обычно выше их трудовая активность. При этом заметен разброс по странам, где высокий уровень образования не всегда сопровождается высокой занятостью, что указывает на влияние дополнительных факторов, таких как культурные нормы, политика занятости или доступность рабочих мест. Подписи годов позволяют увидеть динамику: в большинстве стран обе величины постепенно растут, отражая прогресс в сфере гендерного равенства.

0

Мы не можем напрямую измерить «равенство», поэтому: берем разницу между мужчинами и женщинами смотрим, уменьшился ли разрыв со временем.

В большинстве стран гендерный разрыв в участии в рабочей силе сократился, однако в значительной доле стран изменения остаются несущественными.

В коде строится точечная диаграмма (scatter plot), показывающая связь между уровнем образования женщин (Value_edu) и их участием в рабочей силе (Value_labor). Значения Value_labor делятся на три диапазона и окрашиваются в разные цвета (ACCENT_COLOR, WARNING_COLOR, PRIMARY_COLOR). Размер точек зависит от уровня образования. Для крайних значений (выбросов) добавляются подписи с названиями стран. Добавлены оси, заголовок, сетка и легенда с пояснением цветовой шкалы.

Круговая диаграмма

Здесь мы рассчитываем гендерный разрыв в участии в рабочей силе по странам, сравнивая мужчин и женщин. Он берёт средние значения разрыва за начальный (2000–2005) и конечный (2015–2020) периоды, вычисляет изменение и классифицирует страны на три группы: «Улучшили», «Ухудшили» и «Без существенных изменений». Результат визуализируется в виде круговой диаграммы, где цветами обозначены три категории изменения

Original size 605x620
0

Столбчатая диаграмма

Здесь строится горизонтальная столбчатая диаграмма для визуализации топ-10 стран по уровню гендерного равенства в участии в рабочей силе. Данные сортируются по нормализованному индексу равенства, страны располагаются по возрастанию для удобного чтения, добавлены подписи с точными значениями, сетка и аккуратное оформление графика. Диаграмма позволяет быстро увидеть лидеров по равенству в рабочей силе

Original size 1087x587

top10 = country_score.sort_values (ascending=False).head (10) top10_sorted = top10.sort_values () fig, ax = plt.subplots (figsize=(11, 6))

bars = ax.barh ( top10_sorted.index, top10_sorted.values, color=PRIMARY_COLOR )

ax.set_title ( 'Top 10 стран по уровню гендерного равенства\n' '(участие в рабочей силе)', pad=15 ) ax.set_xlabel ('Нормализованный индекс равенства')

ax.set_xlim (0.7, 1.0)

ax.grid (axis='x', linestyle='--', alpha=0.5) ax.set_axisbelow (True) ax.spines[['top', 'right', 'left']].set_visible (False) ax.tick_params (axis='y', length=0)

for bar in bars: value = bar.get_width () ax.text ( value + 0.005, bar.get_y () + bar.get_height () / 2, f'{value:.2f}', va='center', fontsize=10 )

plt.tight_layout () plt.show ()

Original size 1087x587

Я также построила горизонтальную столбчатую диаграмму для визуализации топ-10 стран с наибольшим гендерным неравенством в участии в рабочей силе. Страны сортируются по нормализованному индексу равенства, добавлены подписи с точными значениями, сетка и минималистичное оформление графика. Диаграмма позволяет быстро определить страны с наименьшим уровнем гендерного равенства.

fig, ax = plt.subplots (figsize=(11, 6))

bars = ax.barh ( bottom10_sorted.index, bottom10_sorted.values, color=ACCENT_COLOR )

ax.set_title ('Top 10 стран по уровню гендерного неравенства', pad=15) ax.set_xlabel ('Нормализованный индекс равенства') ax.set_xlim (0.0, 0.7)

ax.grid (axis='x', linestyle='--', alpha=0.5) ax.spines[['top', 'right', 'left']].set_visible (False) ax.tick_params (axis='y', length=0)

for bar in bars: ax.text ( bar.get_width () + 0.01, bar.get_y () + bar.get_height () / 2, f'{bar.get_width ():.2f}', va='center' )

plt.tight_layout () plt.show ()

Для оценки гендерного равенства был построен нормализованный индекс, основанный на разрыве в участии мужчин и женщин в рабочей силе. Анализ выявил значительную дифференциацию между странами: в ряде государств наблюдается почти полное равенство, тогда как в других разрыв остаётся устойчиво высоким.

Тепловая карта корреляции

0

Для выявления взаимосвязей между числовыми показателями была построена тепловая карта корреляций. Анализ показывает высокую положительную корреляцию между значениями показателей в соседние годы, что указывает на устойчивые долгосрочные тренды. Отсутствие резких отрицательных корреляций свидетельствует о постепенных, а не скачкообразных изменениях в данных.

num_cols = [col for col in df.columns if col.isdigit ()]

df[num_cols] = df[num_cols].apply (pd.to_numeric, errors='coerce') plt.figure (figsize=(14, 10))

sns.heatmap ( df[num_cols].corr (), cmap="coolwarm», annot=False, linewidths=0.5 )

plt.title («Тепловая карта корреляции», fontsize=14, pad=15) plt.tight_layout () plt.show () num_cols_5y = [col for col in num_cols if int (col) % 5 == 0]

plt.figure (figsize=(14, 10)) sns.heatmap ( df[num_cols_5y].corr (), cmap="coolwarm», annot=False, linewidths=0.5 )

plt.title («Тепловая карта корреляции (каждые 5 лет)», fontsize=14, pad=15) plt.show ()

Мой код строит тепловую карту корреляций между числовыми колонками датафрейма df. Сначала выбираются все годовые колонки и приводятся к числовому типу. Затем с помощью Seaborn вычисляется матрица корреляций и визуализируется через тепловую карту с цветовой схемой coolwarm. В конце создаётся отдельный список колонок через каждые 5 лет (num_cols_5y) для дальнейшего анализа или визуализации.

Выводы

Original size 1344x768

В процессе работы с мировым датасетом, посвящённым показателям гендерного равенства, я построила несколько типов визуализаций, которые позволили рассмотреть проблему с разных сторон: во временной динамике, в сравнении между странами и через оценку масштабов изменений за последние два десятилетия. Вместо одного упрощённого представления о «равенстве» получилась многослойная картина, в которой сочетаются глобальные тенденции и заметные различия между отдельными странами и регионами.

Совместный анализ линейных графиков, круговой диаграммы, столбчатых сравнений и тепловой карты корреляций позволяет выделить несколько ключевых наблюдений: В глобальном среднем наблюдается постепенное сокращение гендерного разрыва в участии в рабочей силе, что указывает на общее движение в сторону большего равенства.

Описание применения генеративной модели

В ходе работы над проектом были использованы инструменты искусственного интеллекта в качестве вспомогательных средств анализа и визуального оформления. Модель ChatGPT применялась для структурирования этапов обработки данных, уточнения логики расчётов показателей, формулирования индексов и проработки концепции визуализаций. Кроме того, с её помощью был доработан визуальный стиль графиков и сформулированы аналитические пояснения и выводы к результатам.

Для визуального оформления проекта и создания обложки была использована платформа Leonardo AI, которая позволила сгенерировать иллюстрацию и стилистическое решение, соответствующие тематике гендерного равенства и визуальному языку проекта.

Важно отметить, что инструменты искусственного интеллекта не заменяли аналитическую работу, а использовались как средство поддержки для уточнения структуры, повышения выразительности визуализаций и улучшения качества представления результатов.

Промпты для Leonardo AI: -обложка: «Realistic digital illustration of a man and a woman facing each other in a subtle stance of opposition, representing gender equality in opportunities. Use a bold color palette of red, blue, and yellow. High-detail, realistic proportions and facial expressions, modern and professional style, dramatic yet balanced composition, background with subtle abstract data and technology elements, cinematic lighting, suitable for a presentation cover.» -иллюстрация: «Hyper-realistic digital illustration of a man and a woman standing back-to-back, connected by abstract streams of data and glowing lines, symbolizing gender equality and collaboration in opportunities. Bold, vibrant color palette with red, blue, and yellow. Detailed, realistic facial expressions and proportions, cinematic lighting with soft shadows. Futuristic yet professional style, balanced and dynamic composition, subtle abstract data, graphs, and technology motifs in the background. Suitable for a striking and modern presentation cover.» -иллюстрация: «Vector-style infographic illustration showing male and female icons balanced on a scale, surrounded by abstract data graphs and charts. Bold primary colors red (

D62728), blue (

1F77B4), yellow (#FFD700). Minimalist, clean, modern professional design, suitable for educational or analytical presentation»

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more