Original size 1140x1600

Психическое здоровье в цифрах: анализ данных

PROTECT STATUS: not protected
3

Концепция

Психическое здоровье — это важная тема, которая затрагивает миллионы людей по всему миру. Анализ этих данных может помочь выявить закономерности и взаимосвязи между различными факторами (например, сном, социальной поддержкой) и уровнем депрессии или стресса. Это может быть полезно для разработки стратегий улучшения психического здоровья.

Источник данных

Я выбрала датасет «Anxiety and Depression Mental Health Factors» (Факторы психического здоровья: тревога и депрессия), который находится на платформе Kaggle:

https://www.kaggle.com/datasets/ak0212/anxiety-and-depression-mental-health-factors

Этот набор данных содержит информацию о различных факторах, влияющих на психическое здоровье, таких как возраст, пол, уровень образования, социальная поддержка, часы сна, уровень депрессии, уровень стресса и др.

Типы графиков

Для визуализации данных я выбрала следующие типы графиков:

Гистограммы — для анализа распределения уровней депрессии и стресса.

Столбчатые диаграммы — для сравнения средних значений уровня депрессии и стресса по полу.

Линейные графики — для анализа зависимости уровня депрессии от часов сна.

Круговые диаграммы — для визуализации распределения уровня образования среди участников.

Облака слов — для визуализации текстовых данных.

Этапы работы

Я начала с подготовки среды для работы. Для этого я установила все необходимые библиотеки: pandas для работы с данными, matplotlib и seaborn для визуализации, а также wordcloud для создания облаков слов. После установки я импортировал их в свой код.

Чтобы графики выглядели красиво и консистентно, я настроила стиль с помощью seaborn, выбрав минималистичный дизайн с зеленой палитрой. Это помогло мне сразу задать тон для всех будущих визуализаций.

Original size 1000x300

Следующим шагом я загрузила данные из CSV-файла. Для этого я использовала функцию pd.read_csv (). Чтобы убедиться, что данные загрузились корректно, я вывела первые несколько строк с помощью data.head (). Это позволило мне быстро ознакомиться со структурой данных и понять, какие столбцы мне понадобятся для анализа.

Original size 1000x300

Визуализацию я начала с гистограмм, чтобы понять, как распределены уровни депрессии и стресса. Для этого я использовала sns.histplot (), добавив параметр kde=True, чтобы на графике отображалась кривая плотности. Это помогло мне увидеть, что большинство значений сосредоточено в определенном диапазоне.

Затем я решила исследовать зависимость уровня депрессии от часов сна. Для этого я построила линейный график с помощью sns.lineplot (). На графике я увидела, что с увеличением часов сна уровень депрессии снижается.

0

Чтобы сравнить уровни депрессии и стресса по полу, я создала две столбчатые диаграммы. Использовав sns.barplot (), я разместила их рядом друг с другом, чтобы было удобно сравнивать. Это помогло мне заметить, что у женщин уровень стресса в среднем выше, чем у мужчин.

Original size 1183x584

Для визуализации распределения уровня образования я использовала круговую диаграмму. Сначала я подсчитала количество участников для каждого уровня образования с помощью value_counts (), а затем построила диаграмму с помощью plt.pie (). Это позволило мне быстро увидеть, какие уровни образования наиболее распространены.

Original size 1000x300
Original size 662x658

Наконец, я решила добавить облака слов, чтобы визуализировать текстовые данные. Для этого я использовала библиотеку wordcloud. Я объединила текстовые данные в одну строку и создала облако слов. Это помогло мне увидеть, какие уровни образования и статусы занятости встречаются чаще всего.

Original size 1000x300
0

Чтобы графики выглядели профессионально, я уделила внимание их стилизации. Я использовала зеленую палитру для всех графиков, чтобы сохранить единый стиль. Для облаков слов я выбрала минималистичный дизайн с белым фоном и зелеными словами, чтобы они гармонировали с остальными графиками.

На последнем этапе я сохранила все графики в формате PNG, чтобы их можно было использовать в презентации. Для этого я использовал функцию plt.savefig ()

Original size 1000x300

Описание применения генеративной модели

Была применена генеративная модель https://chat.deepseek.com/ с целью генерации инструкций и рекомендаций по улучшению кода, а также для решения вопросов, связанных с правильным использованием функций, библиотек и других элементов программирования.

Психическое здоровье в цифрах: анализ данных
3
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more