Выбранные данные для анализа
Для анализа я выбрала данные CSV-файла с историческими данными акций крупнейших технологических компаний в период с 2016 по 2026 год.
В ходе анализа были рассмотрены данные следующих компаний: Apple (AAPL), Amazon (AMZN), Google (GOOGL), Meta (META), Microsoft (MSFT), NVIDIA (NVDA)
CSV-файл по ссылке содержит ежедневные исторические данные по фондовому рынку ведущих мировых технологических компаний, входящих в группу FAANG+, дополненные индикаторами технического анализа и прогнозируемой целевой ценой закрытия на следующий день.
Каждая строка представляет один торговый день для одной компании, что делает набор данных идеальным для:
- Прогнозирования временных рядов - Регрессионного моделирования - Финансового машинного обучения - Анализа технических индикаторов
Набор данных предварительно обработан и содержит элементы, поэтому пользователи могут сразу же приступить к моделированию без дополнительных вычислений.
Ценность и актуальность выбранных данных
- Практическая значимость: технологические компании составляют основу современных индексов S&P 500 и NASDAQ
- Образовательная ценность: данные содержат комплексные технические индикаторы для изучения финансового анализа
- Актуальность: период данных включает ключевые события, повлиявшие на мировую экономику (пандемия, инфляция, технологический бум)
- Дизайн-потенциал: разнообразие метрик позволяет создавать многокомпонентные визуализации
Несмотря на то что моя основная профессиональная сфера связана с дизайном одежды, мне было особенно интересно поработать с финансовыми данными технологических компаний, потому что мода и технологии сегодня тесно переплетаются. Крупные IT-компании во многом формируют визуальную культуру, цифровую среду и инструменты, которыми пользуются дизайнеры: от графических программ до платформ для продвижения брендов. Анализ данных позволил мне взглянуть на знакомый креативный мир с другой, аналитической стороны.
Кроме того, финансовые временные ряды — это наглядный и структурированный тип данных, где хорошо видны тренды, взлёты, падения и цикличность. Это во многом похоже на модную индустрию, где тоже есть тенденции, сезонность и влияние внешних факторов.
Также мне было важно освоить навыки визуализации данных с анализом сложной информации. Как дизайнер, я привыкла работать с формой, цветом и композицией, этот проект стал возможностью применить те же принципы, но уже к данным, а не к одежде.
Выбранные графики для анализа
- Многоуровневые графики: для комплексного анализа взаимосвязанных метрик
- Сеточные компоновки: для сравнения разных аспектов данных
- Комбинированные графики: для отображения данных разных масштабов
- Статистические графики: для анализа распределений и ошибок
- Дашборды: для сводного представления ключевых инсайтов
Стилизация графиков
Основные источники вдохновения, взятые для визуализации данных:
Bloomberg Terminal — профессиональные финансовые дашборды
Material Design от Google — принципы современного UI/UX
Financial Times Visual Journalism — информационный дизайн в СМИ
Используемые статистические методы
Базовые вычисления
Python
Общая доходность
total_return = (end_price / start_price — 1) * 100
Скользящие средние
sma_21 = close.rolling (window=21).mean ()
Волатильность
volatility = returns.rolling (window=7).std ()
Технические индикаторы
RSI (Relative Strength Index) — индекс относительной силы — Формула: RSI = 100 — (100 / (1 + RS)) — Пороги: >70 (перекупленность), <30 (перепроданность)
MACD (Moving Average Convergence Divergence) — MACD = EMA (12) — EMA (26) — Signal = EMA (MACD, 9)
Полосы Боллинджера — Средняя = SMA (20) — Верхняя = Средняя + 2×σ — Нижняя = Средняя — 2×σ
Метрики точности
prediction_error = (predicted — actual) / actual * 100 accuracy = (abs (errors) < 2).mean () * 100
ИТОГОВЫЕ ГРАФИКИ ДЛЯ АНАЛИЗА
Многоуровневая визуализация эволюции цен с техническими индикаторами:
- Трехуровневая компоновка позволяет показать разные аспекты данных на одном графике - Цены закрытия с SMA-21 демонстрируют основной тренд и скользящее среднее - RSI-14 индикатор показывает уровни перекупленности/перепроданности - Градиентные заливки по годам улучшают восприятие временных периодов
Комплексный анализ технических индикаторов в сеточной компоновке:
- Grid layout (2×2) оптимален для сравнения разных типов визуализаций - MACD индикатор с сигнальной линией показывает трендовые сигналы - Тепловая карта волатильности визуализирует матричные данные по годам и компаниям
Анализ объемов торгов с использованием двойных осей и тепловых карт:
- Dual y-axis график позволяет одновременно анализировать цену и объем на разных масштабах - Горизонтальные bar chart для суммарных объемов обеспечивают лучшую читаемость длинных названий компаний - Тепловая карта объемов по месяцам выявляет сезонные паттерны торговой активности - Заполнение области (fill_between) подчеркивает динамику объемов относительно цены
Анализ точности предсказаний цен с визуализацией ошибок:
- Сравнение фактических и предсказанных цен показывает качество прогнозных моделей - Box plot ошибок предсказания анализирует распределение ошибок по компаниям - Bar chart точности с цветовой кодировкой (зеленый/красный) быстро показывает успешность предсказаний
Сводный дашборд ключевых метрик технологических компаний:
- Четырехпанельный дашборд обеспечивает комплексный обзор метрик - Горизонтальные бары доходности с цветовой индикацией (зеленый/красный) показывают успешность инвестиций - Donut chart волатильности визуализирует относительные риски компаний - Grouped bar chart объемов и RSI сравнивает два важных показателя одновременно - Короткие подписи обеспечивают читаемость даже с длинными названиями компаний
Описание применения генеративной модели
Анализ данных и его визуализация были выполнены с помощью использования ИИ, основные цели:
Генерация структуры кода — создание архитектуры класса анализатора
Дизайн-рекомендации — подбор цветовых палитр и композиционных решений
Документация — создание подробных отчетов и комментариев
Идеи для визуализаций — предложения по типам графиков и их компоновке
Результативность: — ускорение разработки: в 3 раза быстрее ручного кодирования — качество кода: улучшенная структура и читаемость — дизайн-решения: профессиональные визуализации — документация: полное описание методологии
Примеры использования ИИ с конкретными промптами:
Промпт 1 (структура проекта): Создай класс на Python для анализа данных акций с акцентом на дизайн визуализаций. Данные содержат: дату, тикер, цены, объемы, технические индикаторы. Нужно 5 разных визуализаций с кастомной стилизацией.
Промпт 2 (дизайн-решения): Предложи цветовую палитру для 6 технологических компаний: Apple, Amazon, Google, Meta, Microsoft, NVIDIA. Используй брендовые цвета компаний.
Промпт 3 (статистический анализ): Опиши статистические методы, используемые в анализе акций: скользящие средние, RSI, MACD, волатильность, корреляция. Объясни формулы и интерпретацию результатов.
Заключение
Проект представляет собой целостное исследование финансовых данных, в котором аналитическая глубина сочетается с продуманным визуальным оформлением результатов. В работе реализован автоматизированный пайплайн обработки и анализа данных, обеспечивающий воспроизводимость и эффективность исследования, а выводы подкреплены применением финансовых индикаторов и статистических методов. Особое внимание уделено качеству визуализаций и принципам информационного дизайна, что делает интерпретацию результатов наглядной и профессиональной. Проект также сопровождается подробной документацией, описывающей методологию и этапы работы. В процессе выполнения были продемонстрированы навыки анализа временных рядов, статистической обработки данных, разработки визуальных решений и грамотного документирования аналитических процессов.



