Original size 1240x1748

Анализ рынка недвижимости Москвы

PROTECT STATUS: not protected
The project is taking part in the competition

Анализ рынка недвижимости Москвы

Вводная часть

1. Выбор данных и их источник

Я выбрала для анализа данные о недвижимости Москвы. Это синтетический (симулированный) датасет, созданный с помощью Python, который имитирует реальные данные из открытых источников (таких как Росреестр, открытые данные правительства Москвы). Датасет содержит 1000 записей с информацией о типе объекта, адресе, округе, годе постройки, площади, этажности, статусе и кадастровом номере.

Почему именно эти данные?

Недвижимость — это одна из самых значимых и динамичных отраслей экономики Москвы. Данные позволяют проанализировать исторические тренды, распределение объектов по округам и типам, что может быть полезно для инвесторов, риелторов, градостроителей и аналитиков. Объём данных (1000 записей) достаточен для проведения статистического анализа и визуализации, но не слишком велик для учебного проекта.

2. Виды графиков и их обоснование

Для визуализации я выбрал следующие типы графиков:

Столбчатая диаграмма — для сравнения количества объектов по типам. Круговая диаграмма — для отображения долей округов. Линейный график — для демонстрации трендов по годам. Тепловая карта — для анализа распределения объектов по округам и типам. Гистограмма и boxplot — для изучения распределения площади. Горизонтальная столбчатая диаграмма — для сравнения среднего возраста по округам. Корреляционная матрица — для изучения взаимосвязей числовых признаков. Эти графики позволяют охватить как общую картину (доли, распределение), так и детализированные тренды и взаимосвязи.

Этапы работы

1. Обработка данных

Данные были созданы синтетически с помощью библиотеки numpy и обработаны в pandas. Код включает следующие этапы:

import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns

Создание синтетических данных

np.random.seed (42) n_records = 1000

Генерация признаков: object_type, district, built_year, area, floors и др.

Добавление производных признаков: age, area_category

2. Статистический анализ данных

Использованные статистические методы:

Описательная статистика: среднее, медиана, стандартное отклонение Анализ распределений: гистограммы, квантили Корреляционный анализ: матрица корреляций Пирсона Временной анализ: скользящее среднее для сглаживания трендов Сравнение групп: группировка по категориям с расчетом агрегированных показателей

3. Стилизация графиков

Для стилизации я выбрал:

Цветовая палитра: viridis (из библиотеки Seaborn), которая обеспечивает хорошую контрастность и доступность для цветовосприятия. Шрифт: Стандартный шрифт Matplotlib с увеличенным размером для лучшей читаемости. Стиль: seaborn-v0_8-darkgrid для чистого и современного вида.

plt.style.use ('seaborn-v0_8-darkgrid') sns.set_palette («viridis») plt.rcParams['figure.figsize'] = (12, 8) plt.rcParams['font.size'] = 12

4. Изучающий и объясняющий формат визуализации

Изучающий формат: Тепловая карта и корреляционная матрица помогают выявить скрытые закономерности (например, какие типы объектов преобладают в каких округах). Объясняющий формат: Линейный график с трендами и аннотациями помогает понять историческую динамику строительства.

5. Статистические методы

В проекте использованы:

Описательная статистика: mean, median, std, min, max. Корреляционный анализ: Матрица корреляции Пирсона для числовых признаков. Скользящее среднее: Для сглаживания временного ряда (линейный график). Группировка и агрегация: Для анализа по округам и типам объектов. Визуальная статистика: Гистограммы, boxplot, pie-чарты.

Итоговые графики:

Original size 1280x777

Распределение объектов недвижимости по округам и типам

Original size 1280x640

Динамика ввода объектов недвижимости в эксплуатацию в Москве

Original size 1280x640

Средний возраст объектов недвижимости по административным округам Москвы

Original size 1000x800

Корреляционная матрица числовых признаков

Original size 1280x650

Распределение объектов недвижимости по административным округам Москвы

Original size 1280x480

Распределение площади объектов недвижимости Распределение площади по типам объектов

Заключение

Проект демонстрирует возможности анализа и визуализации данных на примере рынка недвижимости Москвы. Были использованы современные библиотеки Python, применены статистические методы и создана стилизованная инфографика. Результаты могут быть использованы для дальнейшего анализа, прогнозирования и принятия решений в сфере недвижимости.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more