Original size 1143x1600

Анализ данных и визуализация датасета «Personalized Learning Dataset»

PROTECT STATUS: not protected

Данные

Для анализа я выбрала датасет «Personalized_Learning_Dataset», который содержит информацию о характеристиках обучения людей различного возраста по техническим направлениям.

В датасете есть такие данные, как возраст учащихся, пол, уровень обучения, название курса, стиль обучения и тд.

Источник: датасет был найден на платфоре Kaggle.

Почему эти данные интересны?

Актуальность: Анализ больших данных в области образования способствует улучшению качества обучения и помогает принимать более обоснованные решения на всех уровнях образовательного процесса.

Ценность данных: Изучение больших объемов данных, в которых представлены различные характеристики обучения может стать основой для создания новых методик и технологий в образовании, что в итоге улучшает качество обучения.

big
Original size 2049x1134

Типы графиков

— Круговая диаграмма: чтобы показать соотношение популярности учебных курсов. Круговая диаграмма удобно иллюстрирует визуализацию долевого распределения.

— Лепестковая диаграмма: чтобы отразить популярность стилей обучения среди студентов. Лепестковая диаграмма полезна для отражения процентного соотношения категорий данных.

— Линейный график: чтобы визуализировать динамику просмотра видео-уроков в зависимости от возраста. Линейный график хорошо подходит для отображения частых изменений какого-то значения.

— Столбчатая диаграмма: чтобы сравнить распределение учеников в зависимости от их пола и уровня образования. Столбчатая диаграмма прекрасно отражает значения категорий.

— Тепловая карта: чтобы показать распределение студентов по курсу и полу. Тепловая карта помогает визуализировать взаимосвязи между категориями данных.

— Гистограмма: чтобы показать уровень вовлеченности студентов относительно разных курсов обучения. Гистограммы идеально подходят для отображения категорий данных относительно друг друга.

Этапы работы

Мой путь обработки данных:

Загрузка данных: import pandas as pd df = pd.read_csv ('/content/personalized_learning_dataset.csv')

Удаление дубликатов: df_cleaned = df.drop_duplicates ()

Сортировка столбцов с числовыми значениями: sorted_df = df.sort_values (by='Age', ascending=True) sorted_df = df.sort_values (by='Time_Spent_on_Videos', ascending=True) и тд.

Использование нейросетей

Модель: для генерации идей по стилизации графиков и исправления ошибок в коде я использовала ChatGPT (Open AI)

Промпты:

«Как стилизовать графики про обучение?»

«Какие цвета использовать для стилизации графиков с большими данными про образование?»

Стилизация графиков

При выборе стиля для своих графиков я вдохновилась современным интерьерным дизайном в учебных заведениях. Использовала светлый фон и спокойные цвета.

Original size 1728x641

Код для стилизации: plt.gca ().set_facecolor ('#FFFACD')

Итоговые графики

Круговая диаграмма

Описание: Показывает соотношение популярности учебных курсов среди всех студентов.

Узнав результаты данного соотношения, можно предположить, в какую сторону движется развитие технологий и создать новые обучающие курсы, которые будут востребованы.

0

Популярность курсов среди учащихся

Лепестковая диаграмма

Описание: отражает популярность стилей обучения среди студентов.

Проанализировав эти данные, обучение можно создавать в формате, который более предпочтителен учащимися, что повысит вовлечённость и интерес к образованию.

0

Популярность стилей обучения

Столбчатая диаграмма

Описание: сравнивает распределение учеников в зависимости от их пола и уровня образования.

Результаты этого графика позволяют сделать вывод о том, что большинство людей уже имеют оконченное образование.

0

Распределение учащихся по полу и уровню образования

Линейный график

Описание: визуализирует динамику просмотра видео-уроков в зависимости от возраста.

Проанализировав данный график, можно понять, что ученикам школьного возраста предпочтительнее преподавать информацию в формате очных лекций. А люди, которые по возрасту, скорее всего, уже работают, с удовольствием будут обучаться на видео-уроках.

0

Динамика просмотра видео-уроков в зависимости от возраста учащихся

Тепловая карта

Описание: показывает распределение студентов по курсу и полу.

Узнав результаты данного соотношения, можно понять, какие технические направления более интересны определенному полу и преподавать данные курсы с учётом приоритетной аудитории.

0

Распределение количества студентов по курсу и полу

Гистограмма

Описание: показывает уровень вовлеченности студентов относительно разных курсов обучения.

Проанализировав эта диаграмму, заметно, что большее количество учеников имеют средний уровень вовлеченности в курсы независимо от возраста, следовательно, имеет значение улучшать преподавание в определенных направлениях.

0

Уровень вовлеченности учащихся по курсам

Выводы

— Большее количество учеников имеют средний уровень вовлеченности в курсы независимо от возраста. Получается, обучение техническим направлением нужно менять так, чтобы оно больше вовлекало и мотивировало обучаться. — Ученики в возрасте 25-ти лет большего всего уделяют времени на просмотр видео-уроков, а школьники меньше. Соответственно, ученикам школьного возраста предпочтительнее преподавать информацию в формате отличном от просмотров обучающих видео. — Обучающихся мужского пола больше, следовательно обучение может быть гибким и подстраиваться под большую аудиторию.

Вся проанализированная информация помогает точечно улучшать существующее образование, предугадывать развитие в определенных направлениях и создавать новые методики обучения.

Анализ данных и визуализация датасета «Personalized Learning Dataset»
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more