
Описание проекта
Twenty one pilots — музыкальная группа, сильно впечатлявшая меня в подростковые годы и повлиявшая на мое формирование как личности. Основной темой из текстов является ментальное здоровье, а главным посылом остается фраза «stay alive», побуждающая продолжать жить, несмотря на все трудности.
Они предлагают уникальное сочетание жанровой эклектики, глубоких текстов и захватывающих выступлений, так что мне как давней поклоннице их творчества было интересно проанализировать их музыку и лирику с точки зрения анализа данных.

Визуальный стиль музыкального альбома Clancy.
В своем исследовании я взяла базу данных 21 pilots discography analysis с сайта соревнований для специалистов по Data Science Kaggle. К сожалению, мне не удалось найти базу данных со всеми текстами группы, так что я сделала такую таблицу самостоятельно, чтобы наиболее полно рассмотреть не только характеристики их мелодий, но и словесную составляющую.
В ходе анализа датасетов для визуализации данных я решила сгенерировать следующие виды графиков, поскольку нашла их наиболее релевантными и наглядными:

Цветовая палитра.
В качестве референса для оформления проекта я взяла визуальный стиль крайнего выпущенного альбома «Clancy» — отсюда взялись и основные цвета для проекта: оттенки белого, черного, красного, желтого, которые были извлечены с помощью сервиса Adobe Color, а также градиентные переходы между ними. Полученные графики я обработала в программе Photoshop: наложила текстуру обложки музыкального альбома.
С составлением большинства кодов мне помог Chat-GPT, который кастомизировал цветовую палитру, редактировал ошибки и укорачивал программу, чтобы итоговые скриншоты хорошо вписывались по размеру в проект на портфолио.
Предварительная подготовка
Как уже было сказано, мне пришлось формировать базу данных с текстами песен, их названиями и альбомами самостоятельно. Для этого я открыла Википедию с дискографией группы и распределением музыкальных треков по альбомам, а затем нашла в интернете тексты, которые впоследствие преобразовала в единую таблицу.
Для удобства написания кода и его большей компактности я преобразовала запись текстов всех песен из построчной в единую строку.
Код для преобразования текста в одну строчку.
На протяжении всех генераций я импортировала необходимые мне библиотеки: numpy, matplotlib.pyplot и pandas. После чего считывала csv-файлы датасетов соответственно и меняла цветовую палитру.
Пример кода для преобразования текстов песен, их названий и альбомов в единую таблицу (Полная версия во вложении).
Итоговые графики
График № 1
Я зацепилась за своеобразный слоган группы «stay alive» и решила проверить, встречается ли слово «alive» в песнях и альбомах, и если да, то сколько раз и где именно.
Результат, визуализированный в виде гистограмм, меня заинтересовал: оказалось, что это прилагательное многократно повторялось в самом успешном и принесшим группе популярность альбоме «Blurryface», что символично можно считать как некую аффирмацию и награду участникам группы за то, что продолжали свое дело. Такой результат соотносится и с диаграммой частотности по песням: в тексте «Lane boy», которая входит в вышеупомянутый альбом, символичное слово встречается более десяти раз. Любопытно, что альбом, в котором ни разу не упоминалось прилагательное «alive», — «Scaled and Icy» — играет важную роль в общем лоре группы и представляет собой как бы подделку на настоящее творчество группы, переворачивая всю квинтэссенцию Twenty one pilots с ног на голову.
Стандартные гистограммы, визуализирующие частотность слова 'alive' в песнях и альбомах Twenty One Pilots.
1. Код построения графика, который показывает сколько раз за альбом встретилось слово 'alive' 2. Код построения графика, отражающего в каких песнях и сколько раз встречается слово 'alive'.
Затем я решила поработать с текстами музыкальных композиций в целом и составила облако слов в целом для всего творчества и каждого альбома в частности.
Кроме часто употребимых глаголов (feel, want, like, know, say, take, see, make, go), встречаются и нестандартные слова, которые выделяют тексты Twenty one pilots среди других групп, определяя их творчество как попытку побега от себя и других и избавления от проблем: way, mind, leave, alone, trying, run, time. Любопытно наличие ярких отрицаний — won’t и don’t need — словно лирический герой текстов отказывается жить и мыслить определенным образом, что как раз напрямую связано с философским и депрессивным характером песен.
Облако частотности слов в песнях Twenty One Pilots.
Облака частотности по альбомам: 1. — Regional at Best, 2. — Vessel, 3. — Blurryface, 4. — Trench, 5. — Scaled and Icy, 6. — Clancy
1. Код для облака наиболее часто встречающихся слов в текстах группы Twenty One Pilots, 2. Код для генерации облака слов для кажлого альбома
График № 2
Затем я перешла к изучению найденного в интернете датасета с разными параметрами песен: duration_ms, valence, danceability, energy, acousticness, loudness, speechiness, instrumentalness, liveness, key_mode, tempo и time_signature.
По построению линейных графиков можно судить о зависимости различных параметров друг от друга: чем громче песня, тем она более энергичная; обратная связь существует между речистостью и громкостью. Также интересно понаблюдать за эволюцией альбомов по годам и проследить развитие творчества группы: с большинством высокими параметрами снова соотносится дебютный Blurryface, который был выпущен в 2015 году.
Линейные графики для для каждой аудио характеристики по годам выхода выпущенных альбомов.
Код для построения линейных графиков.
График № 3
Чтобы рассмотреть распределение этих функций более подробно в другой плоскости, я решила использовать коробчатую диаграмму, которая компактно изображает одномерное распределение упомянутых вероятностей от максимального до минимального значений, проводя медиану и показывая выбросы, т. е. отхождение от среднего значения.
Стоит отметить, что все параметры, кроме речетативности (Speechiness) и громкости (Loudness) почти не имеют погрешности. Мне стало интересно, почему именно эти два параметра отличаются от общей выборки, и я решила проследить их взаимосвязь.
Box Plot график для каждой аудио характеристики по всей выборке.
Код для Box Plot графика для каждой аудио характеристики.
График № 4
Точечная диаграмма очень хорошо демонстрирует корреляцию двух параметров — речетативности (Speechiness) и громкости (Loudness): чем больше слов в песне, тем она менее шумная. Более того, речь идет не просто о тексте, а также о записанных комментариях на фоне и дополнительных звуковых дорожках (бэк вокал, например), которые воспроизводятся одновременно с основной лирикой.
Точечная диаграмма, отражающая зависимость двух параметров: Speechiness и Loudness.
Код для создания точетной диаграммы по двум параметрам.
График № 5
В конце мне захотелось сравнить песни между собой по данным характеристикам. Я сделала выводы о том, что Truce — музыкальная композиция с наименьшей интенсивностью во всей его дискографии, и это правда: она очень спокойная, медленная и жизнеутверждающая благодаря размеренному фортепиано, которое является чуть ли не единственным музыкальным инструментом по ходу мелодии. Трек с наибольшей энергией по показателям — Guns for Hands — как наиболее мощная с большим участием ударных и дополнительных аудиодорожек. Friend, Please не кажется хорошим вариантом, чтобы под нее танцевать, собственно это прослеживается в самом посыле песни: лидер группы писал эту песню как посмертную память о своем друге. С другой стороны, Fake You Out благодаря ее электротехническим музыкальным вставкам идеально подходит для танцев. Valence выражает музыкальную позитивность, передаваемую треком. Такая песня, как No Chances кажется самой мрачной, вторя своему названию.
Столбчатая диаграмма, демонстрирующая распределение песен по показателям: энергичность (Energy), танцевальность (Danceability), музыкальная позитивность (Valence) и речетативность (Speechiness)
Код для построения столбчатой диаграммы по минимальным и максимальным показателям.
Заключение
Благодаря изучению песен и альбомов группы Twenty one pilots, их творчество открылось мне с новой стороны: удивительно, как ребята сплетают воедино тексты и музыку, формулируя определенный посыл. Мне кажется, что для автора самая главная задача — затронуть важные темы не только напрямую, словами, но и с помощью мелодии, и с уверенностью можно сказать, что американский дуэт с этим успешно справляется на протяжении всей своей музыкальной карьеры.
Описание применения генеративной модели