
Концепция
В поиске интересного мне датасета на сайте kaggle.com, я наткнулась на любопытный анализ студентов португальской школы. Этот анализ рассматривает набор данных из 395 старшеклассников, исследуя различные факторы, влияющие на академическую успеваемость. Данные включают демографическую информацию, семейное положение, учебные привычки, факторы образа жизни и академические оценки. Понимая, какие факторы наиболее сильно влияют на успеваемость студентов, педагоги могут разрабатывать более эффективные меры для улучшения результатов обучения.
С помощью графиков, я отслеживала коррелляционную матрицу числа переменных, влияние на оценки: потребления алкоголя в будни/выходные, пол, тип местности, предыдущие неудачи, образование матери/отца, время на учебу, помощь по учебе в семье/школе. Также, провела анализ между пропусками занятий и влияние на итоговую оценку, распределение итоговых оценок, прогресс оценок и сделала корреляцию матрицы и числовых переменных.
Обработка данных
Вывод
Наиболее значимые факторы академической успеваемости
1. Предыдущие неудачи: Студенты с неудачами по предметам в прошлом показали значительно более низкие итоговые оценки. Каждая неудача снижала вероятность успеха примерно на 50%.
2. Время на учебу: Студенты, которые занимались более 5 часов в неделю, получали оценки в среднем на 2 балла выше по сравнению с теми, кто учился менее 2 часов.
3. Потребление алкоголя: Высокий уровень потребления алкоголя (особенно в будние дни) имел сильную отрицательную связь с академической успеваемостью. Студенты с наибольшим уровнем потребления набирали примерно на 3 балла меньше, чем те, кто употреблял алкоголь минимально.
4. Образование родителей: Высокий уровень образования родителей коррелировал с лучшей успеваемостью студентов. Студенты, чьи родители имели высшее образование, набирали в среднем на 2-3 балла больше.
5. Пропуски занятий: Чрезмерные пропуски (>15 за семестр) ассоциировались с низкими оценками. С увеличением числа пропусков успеваемость снижалась.
Динамика изменения оценок
1. Средний рост оценок с G1 до G3 был незначительным (менее 1 балла).
2. Около 60% студентов улучшили свои оценки.
3. 15% сохранили тот же уровень.
4. 25% показали снижение успеваемости.
Анализ уровня успеха
1. Общий уровень успеха: 85%
2. Различия по полу: Девушки имели немного более высокий уровень успеха (87% против 83%).
3. Город против деревни: Городские студенты показывали немного лучшие результаты (86% против 84%).
4. Различия между школами: В школе GP уровень успеха был выше, чем в MS (89% против 81%).
Профиль студента в группе риска
Студенты с высоким риском академической неуспешности обычно имели несколько факторов риска:
1. Предыдущие неудачи
2.Низкое время на учебу (менее 2 часов в неделю)
3.Высокий уровень потребления алкоголя (уровни 3-5)
4.Чрезмерные пропуски занятий (>15)
5.Низкий уровень образования родителей
Блокнот и датасет