Введение

Для проекта по анализу данных я выбрала данные Всемирного доклада о счастье (World Happiness Report). Это ежегодный отчёт, который изучает субъективную оценку качества жизни в разных странах мира. В отчёте счастье измеряется как трёхлетнее среднее по шкале от 0 до 10, полученное на основе опросов жителей. Команда исследователей вычисляет показатели доверительных интервалов и вклад шести объясняющих факторов: логарифм ВВП на душу населения, социальная поддержка, ожидаемая продолжительность здоровой жизни, свобода принятия жизненных решений, щедрость и восприятие коррупции.
Эти данные доступны для свободного скачивания в виде таблицы и обновляются ежегодно.
Мне было интересно проанализировать этот набор данных по нескольким причинам:
Актуальность темы
В условиях стрессовых событий люди всё больше обращают внимание на благополучие и качество жизни. Изучение факторов, влияющих на счастье, позволяет понять, какие сферы требуют поддержки
Репрезентативность
Данные собираются более чем в 140 странах, что даёт возможность сравнить, как экономические и социальные показатели связаны с субъективным счастьем
Содержательность
Помимо итогового рейтинга, в таблице есть вклады отдельных факторов, поэтому можно исследовать их влияние
Источник и формат данных
Я использовала датасет «WHR25 _Data _Figure _2.1v3.xlsx» — это данные из Доклада о счастье 2025 года. На сайте проекта указано, что эта таблица содержит трёхлетние средние значения удовлетворённости жизнью с 2012 года и вклад шести объясняющих факторов
В наборе 13 столбцов:
Year — год наблюдения, Rank — место страны в рейтинге, Country name — название страны, Life evaluation (3-year average) — средняя оценка счастья за три года, Lower whisker и Upper whisker — границы доверительного интервала, Explained by: Log GDP per capita, Explained by: Social support, Explained by: Healthy life expectancy, Explained by: Freedom to make life choices, Explained by: Generosity, Explained by: Perceptions of corruption, Dystopia \+ residual — условный остаток, отражающий базовый уровень счастья.Почему именно эти данные
В 2025 году Финляндия вновь возглавила рейтинг самых счастливых стран (она занимает лидирующую позицию с 2018 года)
Это кажется парадоксом: несмотря на схожие экономические показатели, некоторые страны достигают гораздо более высоких уровней счастья. Анализ показателей даёт возможность увидеть, какие факторы оказывают ключевое влияние и чем отличаются лидеры рейтинга от аутсайдеров. Кроме того, мне было интересно исследовать динамику Германии (родной страны) и сравнить её показатели с средними по Европе.
Этапы работы
Подготовка и чтение данных
Для работы я использовала библиотеку Pandas
Исследовательский анализ
Перед построением графиков я рассчитала простые статистики: средние значения факторов, ранжировала страны по показателю счастья, вычислила корреляцию между факторами и итоговой оценкой
Для анализа динамики я группировала данные по годам и странам, например, так:
Статистические методы
Для углублённого анализа я использовала несколько статистических инструментов:
описательная статистика (среднее, медиана, стандартное отклонение) для оценки распределения баллов счастья;
коэффициент корреляции Пирсона для проверки взаимосвязи между итоговой оценкой и факторами (логарифм ВВП, социальная поддержка, свобода и т. д.);
линейная регрессия (с помощью scipy.stats или sklearn.linear_model) для построения линии тренда на диаграмме рассеяния GDP vs. happiness;
долговременный анализ — сравнение динамики показателей в странах-лидерах и аутсайдерах.
Визуализация и стилизация
Для построения графиков я использовала Matplotlib, а также настроила параметры шрифтов и цветовую палитру для единого стиля. Ниже приведены примеры четырёх разных типов визуализаций.
График 1. Топ 10 самых счастливых стран (2024)
Тип:
горизонтальная столбчатая диаграмма.Что показывает:
рейтинг и среднюю оценку счастья в 2024 году.Пояснение:
на графике хорошо видно, что Финляндия, Дания и Исландия занимают верхние позиции, а различия между ними незначительны.График 2. Динамика уровня счастья в Германии vs. среднее по Европе
Тип:
линейный график.Что показывает:
изменение оценки счастья в Германии за 2011–2024 годы и среднее значение для выбранных европейских стран.Пояснение:
позволяет увидеть, как показатель изменялся во времени и приближалась ли Германия к уровню лидеров.График 3. Влияние экономики на счастье
Тип:
диаграмма рассеяния.Что показывает:
взаимосвязь между логарифмом ВВП на душу населения (gdp) и средней оценкой счастья (score) для 2024 года.Пояснение:
помогает увидеть, как экономическое благополучие соотносится с ощущением счастья. Дополнительно вычисляется коэффициент корреляции и строится линия тренда.График 4. Вклад факторов в счастье: сравнение стран
Тип:
составная (stacked) столбчатая диаграмма.Что показывает:
долю каждого из шести факторов во вкладах в оценку счастья для двух стран — лидера рейтинга (например, Финляндии) и страны с низким рейтингом (например, Афганистана).Пояснение:
видно, что у лидеров высокие показатели по всем факторам, тогда как у стран-аутсайдеров заметно ниже не только GDP, но и социальная поддержка, свобода и здоровье.График 5. Корреляция факторов
Тип:
тепловая карта.Что показывает:
матрица корреляции между оценкой счастья и шестью факторами по странам в 2024 году.Пояснение:
позволяет быстро увидеть, какие факторы сильнее связаны с уровнем счастья.Стилизация инфографики
Чтобы графики выглядели единообразно и современно, я выбрала нежную палитру синего, зелёного и фиолетового цветов (для презентации я свела все к одному цвету для визуальной целостности) и задала следующие настройки matplotlib:
Использование ИИ
Для поиска информации, подбора источников данных, а также для помощи в структурировании презентации и формулировании текстовых пояснений использовался ChatGPT
ChatGPT (OpenAI): https://chat.openai.com
Для создания визуальных материалов, включая обложку проекта и элементы стилистики, использовался сервис Midjourney. С его помощью были сгенерированы изображения, отражающие общую тему проекта и поддерживающие единый визуальный стиль презентации.
Midjourney: https://www.midjourney.com
Выводы и интерпретация
Анализ показал, что Финляндия, Дания и Исландия уверенно удерживают лидерство в рейтинге счастья — с 2018 года и до 2025 года финны неизменно занимают первое место. Для этих стран характерны высокий уровень ВВП, сильная социальная поддержка и очень высокая оценка свободы жизненного выбора.
Экономическое благополучие, измеряемое логарифмом ВВП на душу населения, положительно коррелирует с ощущением счастья; однако коэффициент корреляции меньше 1 (в моём анализе r≈0,70), что свидетельствует о важности и других факторов. Социальная поддержка и здоровье показали схожую, иногда даже более высокую связь с уровнем счастья. Это означает, что инвестиции в здравоохранение и укрепление социальных связей оказывают столь же значимое влияние на благополучие людей, как и экономический рост.
На примере Германии можно увидеть умеренный рост уровня счастья за последний десяток лет, однако он всё ещё отстаёт от средних значений скандинавских стран. Сравнение структуры факторов показало, что у стран-аутсайдеров (например, Афганистан) низкие значения по всем шести компонентам, тогда как у лидеров каждый фактор вносит ощутимый вклад.
Заключение
Визуализация данных Всемирного доклада о счастье помогла увидеть ключевые закономерности: богатство и здоровье — важные, но не единственные составляющие счастья. Не менее критичны социальная поддержка, свобода выбора и доверие (низкий уровень восприятия коррупции). При создании презентации я постаралась не только построить информативные графики, но и оформить их в едином стиле, чтобы результат выглядел как законченная инфографика.
Ссылка на рабочий файл colab https://disk.yandex.ru/d/BnBD2vVfUHDesQ



