Концепция
Космос привлекал меня с детства, вызывая бурю противоречивых эмоций и интереса. Масштабы Вселенной до сих пор до конца не укладываются в моей голове, а космос кажется таким близким и таким далеким одновременно, что становится страшно.
Часто я черпаю вдохновение в завораживающих снимках телескопа Hubble, такие невероятные пейзажи звездного мира не всегда можно увидеть даже в научно-фантастических фильмах, не то что на фотографиях, сделанных в реальности.

снимки телескопа Hubble с сайта NASA
У меня часто рождаются фантазии о том, какой может быть жизнь за пределами планеты Земля. Мне кажется, что Вселенная настолько необъятна и удивительна, что мы попросту не можем быть в ней одиноки.
В связи с этим, мне было очень интересно и даже захватывающе провести исследование экзопланет и их схожести с Землей.

картинка для передачи атмосферы, сгенерированная мной в Gemini
На просторах Kaggle я нашла несколько баз данных по экзопланетам, выбрав наиболее подходящую для моей задачи, использовала ее в проекте.
Наиболее подходящие виды диаграмм, которые будут продемонстрированы для анализа данных:
— Столбчатая диаграмма — Пузырьковая диаграмма (концептуально визуализированная под звездное небо) — Диаграмма рассеяния (визуально похожая на космическую туманность) — Точечная диаграмма (удаленности объектов)
Визуальная часть
Основным вдохновителем стилевого направления стала первая компьютерная игра, не повторяющая уже существующие в реальной жизни игры (как к примеру крестики-нолики), а реализующая новые правила и механики — SPACEWAR!
Мне кажется, не случайно игра была именно на тему космоса — он всегда притягивал внимание людей своим безмолвием и загадочностью, которые открывают огромный простор для фантазии.
Spacewar! (1962)
У первых компьютеров, на которых можно было поиграть в эту игру, были мониторы гексагональной формы и округлые экраны.
Это натолкнуло меня на использование шрифта TT Octosquares, сочетающего в себе: — ретро стиль — угловатость букв (как в компьютерной игре) — строгость и читабельность (шрифт напомнил мне те, что использовались в старых фильмах на панелях космических кораблей.)
мудборд
В палитре я использовала контрастные цвета — морской волны и ярко-оранжевый, а также их оттенки.
Изначально я наткнулась на фотографию восхода солнца, запечатленного из космоса (она указана выше в мудборде).
Немного поработав с оттенками этой фотографии я адаптировала их под тему космоса, через атмосферу космического корабля, а точнее панелей и экранов с горящими надписями, кнопками и т. д.
цветовая гамма
Работа с базой данных
Подготовка к работе состояла выгрузки csv по экзопланетам в датасет, подключения библиотек pandas, numpy и matplotlib.
Изначально я столкнулась с проблемой — что не все данные написаны в едином числовом формате. В каких-то были погрешности, в каких-то буквенные значения и прочие артефакты.
В связи с этим была применена фильтрация данных и приведение данных к единому виду.
Следующим шагом пришло осознание, что для дальнейших вычислений необходимо было вычислить плотность планет.
Это было реализовано по формуле (ρ=M/R³⋅ρJ) и с использованием усредненной плотности Юпитера (1.33 г/см³).
Далее были отсеяны отсутствующие значения, так как не для всех экзопланет известны их массы и радиусы.
После чего была создана функция, определяющая тип экзопланеты согласно классификации NASA.
Последняя строчка кода определяла минимальное количество световых лет, за которое поступит обратный сигнал с планеты (умножается на 2, так как сигнал должен пройти расстояние от земли до планеты и обратно).
обработка данных для вычисления плотности, типа планеты, количество световых лет для получения обратного сигнала с планеты
Описание применения генеративной модели
Я использовала ChatGPT 5.2 для поиска идеи анализа, а также в последствии с подсказками чата GPT писался код.
Также ChatGPT 5.2 использовался для генерации изображений.
График 1
Я решила начать работу с отображения соответствия методов и годов обнаружения экзопланет.
Визуальным вдохновителем была атмосфера электроники и различных приборов внутри космических кораблей — кнопки, панели с изображением тех или иных характеристик.
визуальные референсы
Для визуализации методов и годов открытия планет был использован staked barchart так как одновременно было необходимо было показать распределение открытий по годам и вклад разных методов открытия.
Изначально год открытия был приведен к целым числам, чтобы избежать ошибок.
Потом данные были сгруппированы по ячейкам «год» и «метод», чтобы посчитать количество открытий в каждой группе.
В таблице строки отображают год открытия, столбцы — метод.
Дальше рисуются столбики: каждый год — это один столбик, а внутри него цветные сегменты разных методов (transit, radial vel. и т. д.).
Визуально добавлены скругления, легенда, подписи и сетка, чтобы выглядело как приближенно к визуалу инфографики на панелях космического корабля.
График 2
При создании данного графика было несколько итераций визуализации, начиная с простой столбчатой диаграммы.
В процессе ее создания ко мне пришла идея для более ассоциативно близкой визуализации — воссоздания звездного неба путем пузырьковой диаграммы, где каждая планета это отдельный «пузырь» определенного цвета (в зависимости от типа планеты) и размера (радиуса планеты, относительно других планет в масштабе диаграммы).
Позже, просматривая сайт NASA, я нашла похожий кадр, который подтвердил, что идея визуализации была удачной.
Если ночью в безоблачную погоду и без светового шума посмотреть на звездное небо, то можно заметить, что звезды также имеют разные цвета и интенсивность свечения, это не так сильно заметно в силу того, что все звезды светятся, но все-таки небольшая разница в цвете есть.
Так как в данном графике мы делим планеты на типы (по признакам их температуры и радиуса), то следовательно каждый тип отображаем разным цветом.
Изначально мной была сделана выборка, где были взяты только строки, где есть радиус и тип планеты, а пустые значения были удалены.
В случае, если планет слишком много, берется случайная подвыборка (чтобы график не стал тяжелым).
Размеры кругов нормируются: самые маленькие и самые большие приводятся к удобному диапазону размеров на экране.
Затем запускается «процесс рассеяния»: кружки распределяются равномерно и случайно на холсте.
В конце все кружки изображаются на темном фоне, цвет кружка зависит от типа планеты, и добавляется легенда с наименованием и количеством каждого типа экзопланет, попавших в выборку.
График 3
Анализ на данном графике направлен на выявление максимально схожих с земными условиями экзопланет, по признакам массы, радиуса и приблизительно вычисляемой температуры поверхности экзопланеты.
Визуальная составляющая данного графика была вдохновлена космическими туманностями — облака межзвездного газа, пыли и плазмы, которые выглядят как размытые пятна, поскольку излучают или поглощают свет по-другому, нежели чем окружающее пространство. На основе этого визуала я работала с альфа-каналом для получения небольшой прозрачности точек на графике чтобы воссоздать эффект туманности.
Фотографии космических туманностей с сайта NASA
Для оценки возможности жизни на экзопланете используется несколько математических приближений:
Связь светимости звезды с ее температурой и массой. L~T_col^4*M_col^3,5
Закон обратных квадратов (поток энергии от звезды обратно пропорционален квадрату расстояния от нее)
Равновесная температура Земли 278К и пропорционально потоку энергии в степени ¼.
Предполагаем, что количество отраженной энергии (коэффициент альбедо) аналогичен земному (А=0,3).
Вводим индекс подобия экзопланеты через Гауссову функцию от радиуса и температуры планеты. Hr=exp (−((R−1)/1.5)^2) Ht=exp (−((T−278)/80)^2) H_score = Hr*Ht
где Hr — индекс подобия по радиуса Ht — индекс подобия по температуре H_score — общий индекс по обоим параметрам, так как вероятности перемножаются
На данном графике каждая планета — это точка по координатам «масса (в массах Земли)» и «радиус (в радиусах Земли)».
Цвет точки задается значением H_score: чем выше индекс, тем ближе к оранжевому и дальше от синего становится цвет (через кастомную цветовую карту).
Оси сделаны логарифмическими, чтобы на одном графике были видны и маленькие, и очень большие планеты.
Добавляется цветовая шкала (colorbar), чтобы было понятно, какой цвет какому H_score соответствует.
Настраивается темный фон, белые подписи и шрифт, чтобы выглядело аккуратно.
График 4
В данном графике отобраны топ-10 планет с самым высоким H_score, но показываются они уже на оси расстояний от Земли.
Планеты ставятся по X-координате равной расстоянию в световых годах, а Земля рисуется в точке 0.
Размер кружка зависит от радиуса планеты: крупнее — значит планета больше.
Если несколько планет почти на одинаковом расстоянии, им добавляется небольшой сдвиг по вертикали, чтобы они не пересекали друг на друга.
Подписываются названия планет и добавляются тонкие линии для читаемости.
Цвет планеты снова отражает H_score (через свою цветовую шкалу).
В конце добавляется цветовая шкала.
Исходя из того, что выборка из экзопланет происходила по признакам схожести планет с Землей, они все принадлежат типу планет Rock, что означает каменистость почвы.
Если у нас на Земле форма жизни углеродная, то предположим, что там форма жизни кремниевая. Это означает, что ее жители приспособлены к более высоким температурам и экстремальным условиям.
Совместно с Chat GPT мне удалось сгенерировать гипотетическую визуализацию жителей каменных планет.
Заключение
Я действительно получила удовольствие от разработки и реализации данного проекта, углубилась во многие моменты о которых раньше были только поверхностные знания и открыла для себя много нового и интересного.
В результате исследования были получены графики и диаграммы, а так же список топ 10 кандидатов на экзопланеты потенциально пригодные для внеземной жизни.
Больше всего меня воодушевило, что в результате проверки был найден ряд публикаций о данных экзопланетах, подтверждающий модельные расчеты и правильность применяемых методов и гипотез.
В процессе исследования были использованы физические приближения:
- О связи светимости звезды с ее температурой и массой (в предположении, что звезды в анализируемых системах являются звездами главной последовательности и схожи с Солнцем по металличности)
- Закон обратных квадратов (в предположении низкой пылевой плотности вокруг звезды, то есть ослабление излучения происходит только обратно пропорционально квадрату расстояния от планеты до нее)
- Модели равновесной температуры (исходя из предположения что на изучаемых планетах приблизительно схожие условия по отражаемому световому потоку и распределению)
- Математические методы из статистики и теории вероятностей (используем модель Гауссовой функции для оценки коэффициента вероятности пригодности планеты для жизни, учитывая в модели распределение радиусов и температур по закону Гаусса) и перемножение вероятности одновременных событий (необходимо чтобы размер планеты был в заданном интервале вероятностей и при этом диапазон температур был в заданном интервале существования жидкой воды)
Так как на данный момент доля найденных и исследованных экзопланет мала, а масштабы Вселенной позволяют говорить что по последним исследованиям в наблюдаемой Вселенной насчитывается примерно 10^22 — 10^24 звезд и у многих из них существуют планеты, то можно почти наверняка сказать что многие из них находятся в потенциальной зоне обитаемости и имеют подходящие для жизни условия.
Например из используемого в проекте датасета в ~5000 планет, нашлось как минимум 10 экзопланет с вероятностью подходящих условий свыше 68%, что составляет более 0,2% от имеющихся данных. То есть можно предполагать, что существует порядка 2 * 10^19 — 2 * 10^21 подходящих планет с условиями схожими с земными.



