Исходный размер 1140x1600

Russia Real Estate 2021 Data Analysis

Состав презентации

  1. Вводная часть
  2. Этапы работы
  3. Итоговые графики
  4. Описание применения генеративной модели

Для проведения данного анализа данных я выбрала тему недвижимости, а именно: «Russia Real Estate 2021».

Эта тема показалась мне интересной, так как потенциально касается каждого из нас, ведь вопрос выбора и приобретения собственного недвижимого имущества рано или поздно становится актуальным для каждого жителя мегаполиса.

Источник данных: kaggle Виды используемых графиков: столбчатая диаграмма, ящик с усами, корреляционная матрица, матрица рассеивания.

Этапы работы

Подключаем библиотеку «Pandas». Загружаем данные и читаем их.

big
Исходный размер 2727x786
big
Исходный размер 2745x909
big
Исходный размер 1426x138
big
Исходный размер 1154x926

Большинство жителей обладают недвижимостью площадью меньше 50 м^2

Построим столбчатую диаграмму, которая показывает распределение данных. Ось х — значение данных Ось у — количество раз, сколько они встретились.

Исходный размер 1793x143
Исходный размер 1250x895

Большинство жителей 77-го региона проживают в квартирах с одной или двумя комнатами.

Построим диаграмму «ящик с усами», чтобы посмотреть выбросы данных.

Исходный размер 1591x125
Исходный размер 1202x851

Исходя из данного графика мы можем сделать вывод, что среди всего массива данных ярко выделяются однокомнатные и двухкомнатные квартиры, однако на графике было достигнуто значение « — 1», соотвественно данная квартира является студией.

Построим корреляционную матрицу, чтобы посмотреть, как между собой коррелируют данные.

Исходный размер 1728x150
Исходный размер 515x418

— Мы можем наблюдать, что в корреляционной матрице наиболее изменчивыми значениями являются показатели количества комнат и площади квартиры, что в целом естественно. — На главной диагонали корреляционной матрицы стоят 1-c. Очевидно, поскольку значения полностью соотносятся сами с собой. — Остальные показатели корреляционной матрицы показывают неизмеримо низкую корреляция между вышеуказанными параметрами.

Построим матрицу рассеивания, которая помогает проследить как зависят данные.

Исходный размер 2794x1033
Исходный размер 2313x1580

Построив диаграмму рассеяния, мы видим, что в данных действительно нет очевидной линейной зависимости. Скорее всего, это связано с довольно большим начальным количеством строк в данных.

Описание применения генеративной модели

Для стилизации графиков я использовала Chat GPT «Open AI» Пример промпта: draw purple stripes on the graphics columns. Save the data».

Ссылка на файл

Ссылка на данные

Russia Real Estate 2021 Data Analysis
Проект создан 25.09.2024
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше