Для своего исследования я выбрала данные о найденных метеоритах. Информация было собрана NASA и предоставлена на их официальном сайте. В dataset собрана информация о найденных метеоритиках в разных точках света за несколько последних столетий.
В работе я буду демонстрировать, столбчатые, круговые и линейные графики. Кроме того я использовала наложение данных на карту мира для визуализации данных.
Работа с кодом

Первые строки из dataset
В начале я загрузила dataset в google collab и вывела первые 5 строк таблицы, чтобы изучить какие данные в ней приведены. На этом этапе оформление я задала через стили css. Затем я готовила данные к анализу, в том числе очистила их от лишних пропусков.
Для составления и оформления графиков я использовала такие библиотеки: import matplotlib.pyplot as plt import numpy as np import geopandas as gpd import pandas as pd
Сначала я проанализировала в каком десятилетии было было найдено больше всего метеоритов для этого создаем новый столбец с десятилетиями, распределяем года по декадам. Затем сортируем по возрастанию, чтобы вверху оказались самые большие значения выводим топ 10 на график, видим что в 2000-х было больше всего с большим отрывом.
График с количеством метеоритов в разные десятилетия


Создание графика (1) Оформление графика (2)
Затем я занималась оформлением графика. Я задала ему фон, цвета столбцов, оформила подписи и скрыла ненужные части интерфейса.
Следующим этапом я попробовала вывести закономерность в количестве метеоритов, чтобы предположить, сколько метеоритов будет падать в будущем.
Для этого создаю линейный график, которые показывает количество метеоритов за декаду в хронологическом порядке.
График с количеством упавших метеоритов в каждом десятилетии (1900-2020)
Фильтруем данные (с 1900 по 2020 включительно) считаем количество падений в каждом из них выводим линейный график и задаем ему оформление
Код для составления графика (1) И его оформления (2)
Однако по графику видно, что закономерность вывести не удастся. Большую часть времени количество оставалось в определенных рамках (возможно это связано с тем, что за более ранние периоды сохранилось меньше данных о найденных метеоритах). И единственный статистический скачок произошёл в 2000х, затем график продолжил расти, но уже более плавно. Получается, что данных не достаточно для объективного анализа, и точно сказать, что за период 2020х метеоритов будет еще больше нельзя.
Дальше я узнала на каком материке было найдено больше всего метеоритов. Для этого определяем к какой стране принадлежат координаты метеоритов, затем определяем на каком материке она находится. Считаем количество точек на каждом материке и выводим в виде мировой карты с распределением цветов в зависимости от количества метеоритов.
И задаем оформление карты, настраиваем градиент от белого к бордовому, настраиваем легенду и подписи в ней. Устанавливаем отступы, чтобы изображение лучше читалось


Код для визуала карты
График с распределением найденных метеоритов по континентам
Таким образом мы узнаем, что с огромным отрывом выделяется Антарктида, это может быть связано с тем, что на пустынном материке с белым ландшафтом легче находить останки метеоритов. Достаточное количество метеоритов также было найдено в Африке и южной части Евразии.
В конце я захотела узнать сколько обычно весят метеориты. Я составила диаграмму, которая показывает соотношение веса метеоритов.
График о массе метеоритов
Код для расчета веса метеоритов
Я перевела вес в кг, разбила метеориты на 4 категории: до 1 кг, больше 1 кг, больше 10 кг, больше 100 кг. Затем вывела это в виде графика и настроила его оформление. Ожидаемо оказалось, что большая часть найденных метеоритов была совсем небольшого размера (меньше 1 кг).
Выводы
Рассмотрев графики, я выяснила некоторую информацию о метеоритах. Узнала о местах и годах находок их останков, а также сложила представление об их размере. В будущем подобные статистические данные можно будет использовать для прослеживания закономерностей и разработки гипотез касательно изучения метеоритов в будущем.
Применение генеративных моделей
Сhat gpt — помощь с настройкой визуализаций, корректировка кода для исправления ошибок, помощь в настройке оформления графиков через градиенты. Qween — генерация изображений для оформления работы.





