Привет, Хабр! ?

В этой статье мы рассмотрим, как макроэкономические факторы влияют на стоимость жилья на вторичном рынке в Липецке. Мы проведем эконометрический анализ с использованием регрессионных моделей и различных методов для исключения мультиколлинеарности. Также мы разберем, какие из макроэкономических показателей оказывают наибольшее влияние на цены на жилье в регионе. Если вам интересен рынок недвижимости и методы анализа данных, добро пожаловать в статью!

Российский рынок недвижимости подчиняется общим законам экономики, но в то же время он имеет специфические особенности, характерные для нашей страны. В последние годы наблюдаются противоположные тренды в рынке недвижимости: одни эксперты предсказывают его рост, другие — падение. Как бы то ни было, рынок недвижимости продолжает оставаться важнейшим индикатором состояния национальной экономики и показателем уровня жизни населения.

В 2023 году в Липецкой области отмечался повышенный спрос на квартиры, цены на которые существенно выросли. Боясь обесценивания своих сбережений, жители региона активно вкладывали в недвижимость, продемонстрированно на рисунке 1. По официальным данным Минстроя, в Липецкой области средняя рыночная стоимость жилья в IV квартале 2023 года почти достигла 83 тысяч рублей за 1 кв. м (для сравнения в IV квартале 2022 года – 75 тысяч рублей за 1 кв. м). Отметим, что показатели Минстроя – весьма усредненная величина, которая лишь в общих чертах отражает ситуацию на рынке жилья регионах. По факту, цены ещё выше.

Рисунок 1 – Ценовая динамика на вторичном рынке жилья в Липецке
Рисунок 1 – Ценовая динамика на вторичном рынке жилья в Липецке

Мы будем исследовать, как макроэкономические факторы, такие как:

  • Ставка Центрального Банка России (ЦБ),

  • Прожиточный минимум на душу населения,

  • Уровень инфляции,

влияют на цены на вторичное жилье в Липецке. Это важная тема, так как рынок недвижимости служит индикатором состояния экономики региона и, в общем, страны. На основе анализа данных мы построим регрессионную модель, которая поможет понять, какие из этих факторов оказывают наибольшее влияние на стоимость жилья.

?Источник данных: официальная статистика Ростстата

Данные, представленные в таблице 1, были взяты из официальных источников, таких как Ростстат (Федеральная служба государственной статистики Российской Федерации). В частности, данные о средних ценах на жилье, инфляции, ставках ЦБ и прожиточном минимуме были собраны с использованием открытых статистических публикаций Ростстата для соответствующих лет.

Таблица 1. Источник: данные из Росстата.

Года

Средние цены на вторичном рынке жилья (руб.), (Y1)

Средний размер ставки ЦБ (%, годовых), (X1)

Средний прожиточный минимум на душу населения по Липецкой области (руб.), (X2)

Инфляция (%), (X3)

2003

11897

17

1680,5

11,99

2004

14989

13,5

1915,25

11,74

2005

18103

12

2275,25

10,91

2006

27123

11,25

2684,25

9

2007

43207

10,25

3156

11,87

2008

49143

11,25

3913

13,28

2009

31436

11,72

4504

8,8

2010

38599

8,125

4964

8,78

2011

40152

8,083

5485

6,1

2012

43212

8,25

5724

6,58

2013

45507

5,5

5997

6,45

2014

48960

9,92

6854,25

11,36

2015

44051

12,8

8260,5

12,91

2016

40874

10,25

8413,5

5,4

2017

39013

8,75

8585,75

2,5

2018

41 091

7,5

8686,5

4,3

2019

42 827

6,9

9409,5

3

2020

46 096

5,0625

9761,5

4,9

2021

57992

6,33

9945

8,39

2022

70274

12,0625

10963

11,94

2023

83658

12,9

11931

5,47

?Методология исследования

Для анализа использовались методы корреляционно-регрессионного анализа, а также различные подходы для устранения мультиколлинеарности и создания устойчивых моделей.

1. Построение матрицы парных коэффициентов корреляции

Не смотря на существующее множество факторов, участвующих в процессе ценообразования недвижимости, большинство из них малопригодно для решения задач прогнозирования. В то же время, моделирование динамики основных показателей, также связано с определенными сложностями, такими как нестационарность соответствующих временных рядов, резкие развороты трендов, вызванные кризисными обстоятельствами и другими причинами.

На основании корреляционно-регрессионного анализа была оценена зависимость средних годовых цен на вторичном рынке жилья от ряда макроэкономических показателей, которые, как предполагается, могут оказывать влияние на цену недвижимости в Липецке (руб./кв. м) (Y). В качестве факторов были выбраны: средний размер ставки Центрального Банка (ЦБ) (% годовых) (X_1), средний прожиточный минимум на душу населения по Липецкой области (руб.) (X_2) и уровень инфляции (%) (X_3)(табл. 2). Выбор этих факторов для моделирования обусловлен их потенциальным влиянием на спрос и предложение на рынке недвижимости, что может, в свою очередь, сказываться на формировании цен.

Таблица 2. Матрица парных коэффициентов корреляции.

Y

X1

X2

X3

Y

1,000

X1

-0,284

1,000

X2

0,811

-0,413

1,000

X3

-0,199

0,631

-0,521

1,000

Из данной матрицы можно сделать следующие выводы:

  • Сильная положительная связь между ценой жилья  (Y)и прожиточным минимумом (X_2) (коэффициент корреляции = 0.811).

  • Умеренная положительная связь между ставкой ЦБ (X_1) и уровнем инфляции (X_3) (коэффициент корреляции = 0.631).

  • Умеренная обратная зависимость между прожиточным минимумом (X_2) и уровнем инфляции (X_3) (коэффициент корреляции = -0.521).

Замечание!

Результаты матрицы парных коэффициентов корреляции демонстрируют важные связи между макроэкономическими факторами, что подчеркивает значимость выбранных переменных для анализа цен на недвижимость. Особенно стоит отметить:

Замечание
  • Сильная положительная связь между ценой жилья (Y) и прожиточным минимумом (X_2) (коэффициент корреляции = 0.811). Это подтверждает, что повышение уровня жизни в регионе оказывает значительное влияние на спрос на жильё, что напрямую сказывается на его стоимости.

  • Умеренная положительная связь между ставкой ЦБ (X_1) и уровнем инфляции (X_3) (коэффициент корреляции = 0,631). Это указывает на то, что рост инфляции может влиять на политику Центрального банка, что, в свою очередь, сказывается на доступности ипотечных кредитов и, как следствие, на ценах на жильё.

  • Умеренная обратная зависимость между прожиточным минимумом (X_2) и уровнем инфляции (X_3) (коэффициент корреляции = -0,521). Это может указывать на то, что с ростом инфляции покупательская способность населения снижается, что в свою очередь может ограничить рост прожиточного минимума и, возможно, снизить спрос на жильё.

2. Проверка значимости корреляции

Для проверки значимости полученных коэффициентов была использована гипотеза о значимости коэффициентов корреляции.

На основании критерия Стьюдента (уровень значимости $$  ( \alpha = 0,95 )   $$) значимыми были признан парный коэффициент корреляции   r_{y x_1} и частные коэффициенты корреляции [1,2,8]:

r_{yx_2 / x_1} = 0.795, \quad r_{y x_2 / x_3} = 0.846, \quad r_{x_1x_3 / x_2} = 0.535, \quad r_{x_2x_3 / y} = -0.626

При сравнении коэффициентов парной и частной корреляции видно, что из-за влияния межфакторной зависимости между x_i, где i = 1, 2, 3 происходит завышение оценки тесноты связи между переменными.

Коэффициенты корреляции
  • 0.795 — для связи между ценой и прожиточным минимумом;

  • 0. 846 — для связи между ценой и инфляцией;

  • 0.535 — для связи между инфляцией и прожиточным минимумом;

  • -0.626 — для связи между ставкой ЦБ и инфляцией.

3. Проверка мультиколлинеарности

Один из важных этапов в эконометрическом анализе — это проверка на мультиколлинеарность, которая может исказить результаты модели, если независимые переменные сильно коррелируют между собой.

Для этого был использован коэффициент увеличения дисперсии (VIF), который помогает выявить, существует ли мультиколлинеарность среди переменных. Результаты показали, что VIF для всех пар переменных был ниже критического значения 4, что свидетельствует об отсутствии серьезной мультиколлинеарности:

  • VIF (b_1, _2) = 1. 205;

  • VIF (b_1,_3) = 1. 662;

  • VIF (b_2,_3) = 1. 372;

Ридж-регрессия не подтвердила наличие мультиколлинеарности ( VIFот 4 и выше хотя бы для одного j).

4. Алгоритм Фаррара-Глобера для оценки мультиколлинеарности

Для более точного анализа мультиколлинеарности был применён алгоритм Фаррара-Глобера. Этот алгоритм позволяет провести более детальное тестирование зависимости между переменными:

  1. Тест всех факторов ( \chi^2 -  хи-квадрат):

    •  \chi^2 = 39.47, что больше критического значения   \chi^2 (3; 0.05) = 7.81473, следовательно, присутствует мультиколлинеарность между факторами.

  2. Тест каждого фактора с остальными (критерий Фишера):

    • F_1 = 17.67, F_3 = 24.42, F_4 = 9.29 превосходят критическое значение F_{\text{табл}}(19; 3) = 8.667, что свидетельствует о наличии мультиколлинеарности между переменными  Y, X_2 и X_3.

    • F_2 = 4.76 \leq F_{\text{табл}}​, что указывает на отсутствие мультиколлинеарности между переменной  X_1и другими переменными.

  3. Тест каждой пары факторов (критерий Стьюдента): не все частные коэффициенты корреляции оказались значимыми, что подтверждает необходимость пересмотра набора факторов для дальнейшего анализа.

Этот анализ показал, что переменные Y, X_2,X_3являются мультиколлинеарными друг с другом, в то время как X_1не имеет значимой зависимости с другими переменными.

5. Построение регрессионной модели

Так как критерии проверки привели к разным заключениям, то была выбрана стандартизированная форма уравнения регрессии:

Y = -0.128X_1 + 0.956X_2 + 0.379X_3

где:

  •   Y - средняя цена за 1 кв.м жилья;

  •  X_1 - ставка ЦБ;

  • X_2 - прожиточный минимум на душу населения;

  • X_3 - уровень инфляции.

Так как критерии проверки привели к разным заключениям, то была выбрана стандартизированная форма уравнения регрессии из которой следует, что наибольшее влияние на размер средней цены на недвижимость на вторичном рынке в Липецке оказывает величина среднего прожиточного минимума на душу населения по Липецкой области.

6. Оценка статистической значимости модели

Для оценки статистической значимости модели использовались следующие показатели:

  • Коэффициент детерминации(R^2), который показал, что 73.62% общей вариации цены объясняется изменениями в выбранных факторах.

  • Критерий Фишера, который подтвердил значимость модели.

Однако не все параметры оказались статистически значимы.

Таким образом, проведённое исследование подтвердило значимую роль величины среднего прожиточного минимума на душу населения по региону при формировании цен на жилье в областном центре. Отсутствие статистически значимой связи среди некоторых изученных факторов подчеркивает необходимость дальнейших исследований для более глубокого понимания и определения других потенциальных переменных, влияющих на ситуацию на рынке недвижимости.

Комментарии (6)


  1. Ivan22
    03.12.2024 12:25

    А уровня зарплат нету??? Оу-кей.


    1. IT_Crow Автор
      03.12.2024 12:25

      А как же без этого?) Уровень зарплат уже в процессе анализа.


      1. kompilainenn2
        03.12.2024 12:25

        кто ж вам расскажет, сколько мы тут получаем?


        1. IT_Crow Автор
          03.12.2024 12:25

          Данные о зарплатах можно собирать из различных источников. Росстат регулярно публикует статистику по средним зарплатам в регионах и отраслях, что полезно для общего анализа. Ещё один способ, это использование API hh.ru, которое позволяет собирать данные о вакансиях, включая зарплатные вилки для разных должностей. Конечно, такой подход потребует больше времени и ресурсов, но результат будет стоить усилий.


  1. HabraReaderZH
    03.12.2024 12:25

    Проведя визуальный анализ данных в таблицы №1 я пришёл к выводу, что уменьшение процентной ставки понижает инфляцию. Повышение процентный ставки повышает инфляцию и увеличивает стоимость жилья на вторичном рынке в Липецке. Экстраполяция данной тенденции позволяет нам построить прогноз, что дальнейшее повышение процентной ставки сделает жильё в Липецке самым ликвидным активом в РФ. ))


    1. IT_Crow Автор
      03.12.2024 12:25

      Экстраполяция на основе простого визуального осмотра данных может привести к неверным выводам и ошибочным прогнозам)
      Чтобы разобраться в реальных взаимосвязях между факторами, нужно использовать более точные методы анализа, такие как регрессионный анализ. Важно помнить, что экономические данные всегда подвержены влиянию множества факторов, и если не учитывать все эти нюансы, можно прийти к ошибочным заключениям. Например, процентная ставка может влиять на инфляцию, но не только напрямую — есть ещё другие экономические механизмы. Поэтому, чтобы сделать точные прогнозы, нужно использовать более сложные методы, которые помогут правильно интерпретировать данные и учесть все важные факторы.