
Этот проект вырос из моей работы с первого курса колледжа, посвящённой анализу базы данных малых тел от группы исследователей из Jet Propulsion Laboratory, NASA. В ней в первую очередь уделялось внимание астрономическим законам, но никак не качеству визуализации (пример оттуда находится слева). Сейчас я возвращаюсь к тому же датасету, за пять лет заметно подросшему, с новыми задачами.
Пояснения к датасету
В датасете содержится информация о более 1 490 000 астероидов, их физических и статистических показателях, например:
— большая полуось орбиты (a) — в данном случае характеризует расстояние между астероидом и другим объектом. Измеряется в астрономических единицах (а.е., 1 а. е. = 14 900 000 км, расстояние от Земли до Солнца); — эксцентриситет (e) — показывает, насколько сильно орбита отклоняется от окружности; — и т. д.
Для визуализации используются графики нескольких типов:
— линейная диаграмма; — гистограмма и столбчатая диаграмма; — точечная диаграмма; — диаграмма размаха («ящик с усами»); — тепловая карта.
Оформление
Цветовая гамма вдохновлена шапкой сайта лаборатории, который предоставляет доступ к базе данных.
Моноширинный шрифт заголовков отсылает к интерфейсам сред программирования, в которых очень часто работают исследователи космоса.

Палитра получена при помощи Adobe Color

Итоговая палитра
Обработка данных
- Импорт необходимых библиотек и чтение CSV с данными:

- Очистка данных, подсчёт вхождений в датасет каждого года:
- Поскольку некоторые значения большой полуоси отрицательные, сначала отбрасывается знак минуса. Затем подсчитывается количество объектов с каждым значением большой полуоси меньше 6 а. е.
- Для удобства построения графика две колонки объединяются в одну.
- Очистка данных и введение нового показателя — местоположение астероида: в пределах главного пояса астероидов, непосредственно внутри него или за пределами.
Визуализация и выводы
Линейный график показывает количество новых открытий астероидов по годам. Заметен значительный рост в начале XXI века и последующее падение. Пик открытий приходится на начало 2000-х годов.
Гистограмма показывает распределение астероидов по удалённости от Солнца. Подавляющее большинство малых тел в базе находится в пределах 50 а. е. (для сравнения: большая полуось Плутона составляет 39,4 а. е.).
Но что будет, если приблизиться?
По столбчатой диаграмме становится ясно, что малые тела распределены крайне неравномерно. Самые большие пики отображают главный пояс астероидов, находящийся между Марсом и Юпитером, при этом внутри пояса астероиды также делятся на группы из-за гравитационного влияния на них планет.
Чтобы отобразить на точечной диаграмме каждый из 1,5 миллионов объектов в датасете, кроме большой полуоси выбран эксцентриситет, поскольку для каждого объекта рассчитано его значение. Однако само значение в данном случае нас не интересует.
Диаграмма показывает, на каком приблизительном расстоянии от Земли находятся астероиды, классифицируемые как сближающиеся с Землёй и как потенциально опасные (то есть способные столкнуться с планетой со значительным ущербом). Видно, что для основной массы околоземных астероидов оно составляет ~0,3 а. е., а для потенциально опасных — ~0,05 а. е.
Вертикальные полосы на графике пожно объяснить тем, что в датасете значения большой полуоси после 1 а. е. округляются до меньшего числа знаков после запятой, нежели до.
Диаграмма размаха показывает распределение эксцентриситетов орбит. Большинство значений входит в диапазон от 0 до 0,38. Значение медианы составляет ~0,15.
Карту пришлось центрировать через графический редактор вручную, т. к. из-за особенностей Matplotlib фигура генерируется с большим полем сверху.
Тепловая карта показывает распределение астероидов внутри главного пояса, в его пределах и за его пределами по спектральным классам. Большинство астероидов относится к классам S (каменные), C (углеродные) и X (металлические). Можно заметить, что состав астероидов в трёх группах не различается значительно, разница количественна: так, объекты за пределами главного пояса в целом в выборке практически не представлены.
Обложка
Обложка проекта создана в Processing.
Источники и использованные инструменты
Ссылка на блокнот и датасет


















