
Введение

Автомобиль на рынке — это больше, чем просто способ добраться из пункта А в пункт Б. Возраст, пробег, тип топлива и технические характеристики — всё это формирует цену автомобиля.
Для анализа были выбраны данные об автомобилях марки Audi, взятые из открытого датасета на Kaggle. Набор данных содержит информацию о различных характеристиках автомобилей, включая год выпуска, пробег, цену, тип топлива и другие параметры.
Интерес к анализу этих данных обусловлен несколькими факторами. Во-первых, автомобильный рынок представляет собой важный сектор экономики. Во-вторых, данные позволяют проследить, как меняется стоимость автомобилей в зависимости от их характеристик, что может отражать общие тренды на рынке подержанных автомобилей. Наконец, анализ типа топлива даёт представление о структуре автопарка и степени распространённости альтернативных источников энергии.
Для визуализации были выбраны четыре типа графиков:
- Линейный график
- Точечная диаграмма
- Гистограмма
- Кольцевая диаграмма
Загрузка и обработка данных

Сначала выполняется загрузка и предварительная обработка данных об автомобилях Audi. На первом этапе загружаются необходимые библиотеки, после чего происходит знакомство со структурой датасета — просмотр типов данных, статистик и проверка на наличие пропусков. Затем для обеспечения качества данных все пропущенные значения заполняются: числовые столбцы — медианой, а категориальные — наиболее часто встречающимся значением. В результате получается очищенный и готовый к дальнейшему анализу и визуализации датасет.
Визуализация
[1] Распределение цен по годам
В первую очередь я захотела узнать, как средняя стоимость автомобилей Audi менялась в зависимости от года выпуска — растут ли цены на новые модели и какова динамика изменения цен по годам выпуска.
Линейный график
График показывает, как изменялась средняя цена автомобилей Audi в зависимости от года их выпуска. Линия демонстрирует чёткий восходящий тренд: цены на машины 2000-х годов начинаются на относительно низком уровне, а затем стабильно растут, достигая пика к моделям 2020 года. Это наглядно показывает, что более новые модели Audi в среднем значительно дороже старых.
Код для линейного графика
В этом коде сначала группируются данные, чтобы для каждого года выпуска вычислить среднюю цену автомобиля. Затем с помощью библиотеки Matplotlib строится линейный график с настраиваемым цветом и толщиной линии. В код также включены команды для добавления заголовка, подписей осей, сетки и для фиксации границ осей, чтобы график отображался аккуратно и информативно.
[2] Цена vs пробег
Я хотела проверить, существует ли зависимость между пробегом автомобиля и его ценой — действительно ли машины с большим пробегом дешевле и насколько сильна эта связь.
Точечная диаграмма
На графике показана связь между пробегом и ценой автомобиля. Заметно, что чем больше пробег (чем правее точка на графике), тем обычно ниже цена. При этом разброс значений достаточно велик, что указывает на влияние и других факторов на конечную стоимость.
Код для точечной диаграммы
В этом коде создаётся точечная диаграмма (scatter plot), где каждая точка представляет один автомобиль: по оси X отложен пробег, по оси Y — цена.
[3] Распределение цен на автомобили
Я решила узнать, как распределены цены на Audi — какие ценовые диапазоны наиболее распространены, есть ли аномально дорогие модели и какова общая картина ценовой доступности этих автомобилей.
Гистограмма
График имеет явно выраженную правостороннюю асимметрию: большинство автомобилей сконцентрировано в левой части (более доступный ценовой сегмент), в то время как небольшое количество дорогих моделей образует длинный «хвост» вправо. Это типичное распределение для товаров люксового сегмента.
Код для гистограммы
В этом коде создаётся гистограмма, показывающая количество автомобилей в каждом ценовом диапазоне. Задаются параметры отображения и фиксированные пределы осей, чтобы убрать лишние отступы. График строится с помощью объектно-ориентированного подхода Matplotlib для точного контроля над элементами визуализации.
[4] Типы топлива
Кроме того, я хотела увидеть, какие типы топлива наиболее популярны среди автомобилей Audi.
Кольцевая диаграмма
На этой кольцевой диаграмме показано процентное соотношение автомобилей Audi с разными типами топлива. Бензиновые модели (Petrol) доминируют, составляя более половины всех автомобилей, за ними следуют дизельные (Diesel). Альтернативные типы — гибриды (Hybrid), электрические (Electric) и другие — занимают лишь небольшую долю.
Код для кольцевой диаграммы
В этом коде создаётся кольцевая диаграмма, где каждый сектор соответствует определённому типу топлива, а его размер — количеству автомобилей. Для наглядности задана индивидуальная цветовая палитра (например, красный для бензина, бирюзовый для дизеля), подписи процентов выводятся только для крупных сегментов (>3%), а подробная легенда справа показывает точные числовые значения.
Вывод
На основе визуализации данных можно сделать следующие выводы. Динамика средней цены по годам выпуска показывает стабильный рост стоимости более новых моделей Audi. Зависимость цены от пробега подтверждает ожидаемую тенденцию: автомобили с меньшим пробегом в среднем оцениваются дороже.
Гистограмма цен выявляет, что основная масса автомобилей в выборке относится к среднему ценовому диапазону, тогда как модели премиум-класса встречаются значительно реже. Анализ типов топлива указывает на преобладание автомобилей с бензиновыми и дизельными двигателями, в то время как транспортные средства на альтернативных источниках энергии пока не получили широкого распространения.



