Недавно столкнулся с проблемой выбора квартиры и конечно первым делом решил узнать, что происходит на рынке недвижимости и, как это обычно бывает, половина экспертов с youtube.com говорят, что недвижимость будет расти, другая утверждает, что наоборот цена будет падать. В итоге решил разобраться сам, и вот, что из этого вышло.
© Designed by upklyak / Freepik
Для того чтобы понять как изменялась цена в последнее время, нужно было найти реальные цены продажи недвижимости. Цены с целевых сайтов типа cian.ru или avito.ru не подходят, так как там обычно квартиры уходят со скидкой и реальную цену продажи узнать нельзя, тут я и заметил сайт по продаже недвижимости на котором можно было посмотреть действительную цену за которую купили квартиру. Речь конечно идет о сайте msgr.ru, более подробно о нём можно прочитать в этом обзоре. В двух словах можно сказать, что эта организация занимается реализацией квартир по договору исполненной ренты на торгах.
Чтобы узнать в каких районах Москвы какие цены, а также любопытно было бы посмотреть на какие квартиры торгуются больше, в каких районах покупают ближе к стартовой цене, а в каких цена может сильно измениться. Для этого я в первую очередь спарсил данные с сайта msgr.ru, данные эти делятся на два вида: прошедшие и не прошедшие аукционы, причём квартиры, которые не были проданы могут быть в двух местах сразу.
Спарсенные данные я свёл в таблицу для наглядности:
В таблице приведены данные за последние 10 аукционов.
В приведенной выше таблице в колонке 'A' указана информация об аукционных квартирах (адреса без пробелов и заглавных букв из-за разниц написания в исходных данных), в первой строке указаны даты будущих и прошедщих аукционов. Проданные квартиры заполняюся 'xxx' по строке (это сделано для того, чтобы понять какие квартиры могут быть доступны в ещё не анонсированных аукционах), в верхней строке ячейки указана стартовая цена, а в нижней цена продажи, в ячейках будущих аукционов ссылка с описанием квартиры.
Также в этой таблице можно увидеть некоторые любопытные закономерности, например как правило если квартира не продается за два аукциона, то на третьем аукционе цена будет снижена и так каждые два аукциона, хотя если посмотреть на большей выборке, то из этого правила есть исключения и квартира дешевеет уже на следующий аукцион, если не была продана на первом.
Чтобы понять в каких районах и на какие группы квартир больше торгуются я разместил все адреса на карте:
Ссылка на полную карту.
На карте отмечены адреса квартир которые были или будут проданы, в заголовке метки указана цена продажи (не продажи / аукциона), год продажи и число, с какого раза была продана квартира. Цифра в метке показывает количество комнат в квартире. В описании метки находится информация об прошедших и будущих аукционах, а также адрес (адреса без пробелов и заглавных букв из-за разниц написания в исходных данных) и прочая информация о квартире.
Благодаря карте можно посмотреть как изменялась цена в районе со временем, насколько сильно торгуются на похожие варианты. Из интересного можно отметить, что новый фонд, т.е. квартиры в новых домах даже в районах с плохой транспортной доступностью как правило продаются с торгом, а вот квартиры старого фонда вполне можно купить по стартовой цене или с небольшим торгом. По карте можно сделать примерный прогноз по торгам, рассматривая уже проданные ранее квартиры расположенные вокруг квартиры выставленной на аукцион.
Хотя и не совсем правильно сравнивать квартиры старого и нового фонда, да и аукционные квартиры сильно смещены в сторону старого фонда в силу специфики msgr.ru, но всё же рассмотрим некоторые гистограммы с этими допущениями.
Гистограмма средних цен на квартиры по годам и количеству комнат (Общее количество квартир: 390):
В рублях.
В долларах США.
Средние цены не совсем корректно рассматривать в отрыве от района нахождения, по-этому рассмотрим квартиры в каждом районе отдельно (рассмотренны только районы внутри МКАД).
Гистограмма средних цен на однокомнатные квартиры, разделенные по районам и году (Общее количество однокомнатных квартир: 218):
В рублях.
В долларах США.
График средних цен на однокомнатные квартиры во времени. (График долларов и график рублей наложены друг на друга):
В долларах и в рублях.
Гистограмма средних цен на двухкомнатные квартиры, разделенные по районам и году (Общее количество двухкомнатных квартир: 154):
В рублях.
В долларах США.
График средних цен на двухкомнатные квартиры во времени. (График долларов и график рублей наложены друг на друга):
В долларах и в рублях.
К сожалению трёхкомнатных квартир слишком мало, в силу этого никакой сколько-нибудь корректной гистограммы или графика построить нельзя (Общее количество трёхкомнатных квартир: 18).
В рублях.
В долларах США.
График средних цен на трёхкомнатные квартиры во времени. (График долларов и график рублей наложены друг на друга):
В долларах и в рублях.
Учитывая допущения изложенные выше (опять же, на момент написания статьи в 2020 году прошел только один аукцион), всё же можно сделать некоторые выводы, если посмотреть на распределение цен по районам, то можно заметить, что в целом цена растёт, однако уже сейчас намечается разворот, так цены в некоторых районах начинают разворачиваться, а в других начинает замедляться рост (что в общем-то свидетельствует о достижении максимальных цен и скорее всего последующем их снижении).
Исходный код на github.com
diborn
А что если провести кластеризацию по большему количеству параметров? CHAID, например? Тема очень интересная, главная проблема — причесать данные.
DimaFromMai Автор
Хорошая идея.