
Концепция
Инфаркт миокарда — одно из наиболее распространенных сердечно-сосудистых заболеваний, которое представляет серьезную угрозу для здоровья и жизни людей. Заболеваемость сердечно-сосудистыми заболеваниями продолжает расти, что подчеркивает актуальность исследования факторов риска инфаркта. В своем анализе я использовала датасет «Heart Attack Risk Factors in Russia» [1], который включает историю болезни, физиологические измерения, информацию о демографических показателях и образе жизни пациентов.

Рефборд для стилизации проекта, все фото взяты из Pinterest [3]
Вдохновением для визуального стиля послужили рентген снимки человеческого сердца. Для качественной визуализации я составила рефборд и при помощью Adobe Color [2] составила цветовую гамму. Я выбирала изображения серого и пыльно-красно-розового цветов, чтобы показать насколько часто встречается данное заболевание среди людей, а также изобразить сердце и кровеносные сосуды более нейтральными.
Выбранный шрифт — Roboto, современный гротеск.

Виды графиков:
(01) Гистограмма (02) Круговая диаграмма (03) Тепловая карта (04) Гистограмма
Я выбрала гистограмму (она помогает увидеть распределение возраста среди пациентов), круговую диаграмму (позволяет быстро оценить соотношение мужчин и женщин в датасете), тепловую карту (показывает связи между различными факторами риска) и точечную диаграмму (выявляет зависимость возраста от риска инфаркта). Эти графики обеспечивают ясность и упрощают восприятие ключевых данных.
Обработка данных
В первую очередь я импортирую необходимые библиотеки для для обработки, анализа визуализации данных: pandas, numpy, matplotlib.pyplot и seaborn. Затем считываю файл csv с датасетом.
Применяю ко всем графикам шрифт Roboto из Google Fonts [4]
Для создания круговой диаграммы я считаю количество мужчин и женщин в датасете.
Для создания первой гистограммы извлекаю данные для анализа столбца Age.
Также создаю корреляционную матрицу факторов риска и выбираю числовые столбцы для анализа. Для работы с тепловой картой я обратилась за помощью к Chat-GPT (см. раздел «Описание применения генеративной модели»).
Обрабатываю столбец с уровнем холестерина (Cholesterol) для последней гистограммы.
Визуализация данных
Гистограмма распределения возраста пациентов
Круговая диаграмма пола пациента с инфарктом миокарда
Тепловая карта факторов риска инфаркта миокарда
Описание применения генеративной модели
В процессе работы я обращалась за помощью к Chat-GPT версии 4.0. и DeepSeek-V3. Они помогли мне в оформлении графиков в более привлекательный внешний вид и подсказали как подготовить данные для тепловой карты.
Подробнее: https://docs.google.com/document/d/1mnOg3QtN5OjgdvMO3VxcTA87eM4vCkCFolmAYskulFM/edit?usp=sharing
Ссылки на модели: Chat GPT: https://openai.com/index/gpt-4/ Deepseek: https://www.deepseek.com
Список источников
[1] Heart Attack Risk Factors in Russia // Kaggle URL: https://www.kaggle.com/datasets/ak0212/heart-attack-risk-factors-in-russia?resource=download (дата обращения: 20.03.2025).
[2] Создать // Adobe Color URL: https://color.adobe.com/ru/create/color-wheel (дата обращения: 20.03.2025).
[3] heart attack // Pinterest URL: https://ru.pinterest.com/search/pins/?q=heart%20attack&rs=typed (дата обращения: 20.03.2025).
[4] Roboto // Google Fonts URL: https://fonts.google.com/specimen/Roboto (дата обращения: 21.03.2025).