Indeks urban.one – Metodologia

Indeks urban.one przez

Poznaj wartość swojego mieszkania w 60 sekund!


Metoda wyznaczania indeksów cen na rynku nieruchomości z wykorzystaniem lasów losowych

Rynek cen nieruchomości, dynamicznie zmienia się w czasie, a jedną z metod oceny jego zmienności jest indeks, który opisuje zmianę zachowania rynku przy przejściu z interwału czasowego na interwał czasowy – najczęściej z miesiąca na miesiąc lub z kwartału na kwartał. W niniejszym opracowaniu przedstawiona zostanie metodologia wyznaczania indeksu cen nieruchomości stosowana przez Cenatorium.

Przez indeks cen rozumieć będziemy dalej indeks przedstawiający kształtowanie się cen transakcyjnych nieruchomości w Polsce, oparty na wiarygodnych danych pochodzących z państwowych źródeł, tj. gł. aktów notarialnych zgromadzonych w Bazie Cen Cenatorium. Ceny transakcyjne są rezultatem kształtowania się popytu i podaży dlatego są rzetelną informacją o sytuacji rynkowej. Prezentowany Indeks jest wynikiem przetworzenia transakcji zawartych na rynku nieruchomości w Polsce zgodnie z autorską metodologią prezentowaną w niniejszym dokumencie.

Znanych jest wiele metodologii wyznaczania indeksu cen nieruchomości. Ciekawy przegląd metodologii wyznaczania indeksów cen nieruchomości, opartych o modele hedoniczne, odnaleźć można w opracowaniu opublikowanym przez Narodowy Bank Polski (Widłak, 2010). W przypadku rynku polskiego publikowane indeksy cen są najczęściej indeksami opierającymi się o dane ofertowe lub średnie ceny transakcyjne, obliczone jednak na małej próbie, zaledwie części rynku (np. indeksy publikowane przez agencje obrotu nieruchomościami – Indeks Cen Transakcyjnych Home Broker i Open Finance). Indeksy, których metodologia wyznaczania jest zbliżona, do tych opisywanych przez (Widłak, 2010) stosowane są w Wielkiej Brytanii pod nazwą Halifax House Price Index. Jest to indeks mierzący przybliżone ceny „typowych” domów oparty na hedonicznym modelu regresji, na danych pochodzących ze sprzedaży kredytów hipotecznych. Innym przykładem indeksów są indeksy oparte na danych powtórnej sprzedaży (repeat sales) tych samych nieruchomości. Przykładem takiego indeksu jest FHFA HPI (Federal Housing Finance Agency House Price Index) publikowany w Stanach Zjednoczonych, który bazuje na danych dostarczanych przez Federal National Mortgage Association oraz Federal Home Loan Mortgage Corporation. Jednak są to dane jedynie nieruchomości finansowanych lub refinansowanych, czyli brakuje w nich rynku gotówkowego.

Podział rynku nieruchomości

Rynek nieruchomości jest rynkiem lokalnym. Potwierdzają to badania Cenatorium jak również pozostałe publiczne raporty przedstawiające sytuację na rynku nieruchomości w Polsce. Lokalna różnorodność rynków potwierdzona i prezentowana jest w badaniach Narodowego Banku Polskiego1. NBP dzieli rynek nieruchomości na poszczególne grupy miast1 np. 6M i 10M, które pozwalają odzwierciedlić lokalny charakter rynków i różnice między nimi. Innym podziałem stosowanym przez NBP jest wyszczególnienie 6 największych rynków: Warszawa, Gdańsk, Poznań, Kraków, Wrocław, Łódź.

Firma Cenatorium przyjęła konstrukcję segmentów nieruchomości zgodnie z propozycją NBP. Cenatorium proponuje wyliczenie indeksów cenowych dla następujących typów nieruchomości oraz rynków:

  • Lokale mieszkalne:
    • Indeks ogólnopolski,
    • Indeks: Warszawa,
    • Indeks największych rynków w Polsce (Kraków, Wrocław, Poznań, Gdańsk, Gdynia Łódź).
  • Grunty pod zabudowę:
    • Indeks ogólnopolski,

Zastosowana metodologia

Posiadając duże zbiory danych transakcyjnych, firma Cenatorium zdecydowała się na metodologię wyznaczania indeksów cenowych w oparciu o bezpośrednie wykorzystanie odpowiednich modeli matematycznych. Poza wysoką jakością generowanych indeksów, głównym założeniem stawianym podczas budowy metodologii wyznaczania indeksów, była możliwość automatyzacji procesu ich generowania dla różnych segmentów nieruchomości, niekoniecznie tylko dla lokali mieszkalnych2. W niniejszym dokumencie ze względu na zwięzłość opracowania, przedstawiona została tylko koncepcja wyznaczania algorytmu indeksu cen dla lokali mieszkalnych.3

W stosowanym przez nas podejściu, indeks cenowy dla danej grupy nieruchomości nie jest wartością wynikającą bezpośrednio z rzeczywistych danych transakcyjnych, ale funkcją predykcji odpowiedniego matematycznego modelu danych – w naszym przypadku modelu lasów losowych (model zaproponowany przez Leo Breiman’a4). Lasy losowe są uznawane za jedną z najlepszych metod klasyfikacji; powstały na gruncie problemów klasyfikacyjnych dla mocno niezrównoważonych dużych danych uczących (czyli gdy liczności zbiorów obserwacji z różnych klas bardzo się różnią). W uproszczeniu las losowy, to zbiór drzew decyzyjnych (pojedynczy klasyfikator to klasyczne drzewo decyzyjne). Sprowadzenie zagadnienia wyceny nieruchomości do zadania klasyfikacji wymagało zdyskretyzowania wartości cen transakcyjnych. Założenie to oczywiście nie jest problematyczne, ponieważ w przypadku segmentu nieruchomości o niskich cenach za 1 m2 (np. gruntów rolnych) cena już jest zdyskretyzowana, ponieważ jest podawana w groszach, a w przypadku wyceny segmentów nieruchomości droższych, cena z powodzeniem może być zaokrąglona do całkowitych wielokrotności PLN lub nawet do wielokrotności 10 PLN.

Podejście podobne, ale z wykorzystaniem modeli hedonicznych, od strony teoretycznej rozważane było w monografii (Widłak, 2010). Proponowane rozwiązanie modelu lasów losowych ma wiele zalet, do których zaliczyć należy:

  • możliwość zalgorytmizowanej budowy indeksów dla dowolnych typów nieruchomości, lokali mieszkalnych, gruntów rolnych, budynków, itp.,
  • możliwość zalgorytmizowanej budowy indeksów dla dowolnych segmentów – podzbiorów w ramach określonego typu – nieruchomości, tzn. dla ustalonego typu nieruchomości można ustalić podzbiór nieruchomości o określonych parametrach, np. lokale o powierzchni nie większej niż 35 m2, znajdujące się na pierwszej kondygnacji,
  • możliwość zalgorytmizowanej budowy indeksów dla nieruchomości o określonych współrzędnych geograficznych, czyli możliwość budowy indeksów na różnych poziomie agregacji przestrzennej np. powiatów, województw, itp.
  • możliwość wyznaczania indeksów w chwilach czasowych poza horyzontem czasowym posiadanych danych, tzn. zarówno w odległej historii jak i przyszłości; oczywiście należy się spodziewać, że wraz z oddalaniem się momentu, dla którego wyznaczany jest indeks, od okresu, z którego pochodzą dane użyte do estymacji modelu, na podstawie którego tworzony jest indeks, jakość wyznaczonego indeksu będzie spadała,
  • stabilność generowanych wycen gwarantowaną przez modele lasów losowych; w dużym uproszczeniu, w modelach tych odpowiednie reguły rekomendacyjne bazują na średnich wartościach zmiennych objaśnianych w wytworzonych wewnętrznie segmentach – nie ma więc możliwości wystąpienia niespotykanie wielkich i niespotykanie niskich wartości wycen, które można obserwować w modelach wielomianowych przy wycenie nietypowej nieruchomości, która nie miała odpowiednika w zbiorze uczącym model,
  • możliwość odtworzenia z modelu lasów losowych reguł decyzyjnych, na podstawie których generowane są konkretne wyceny.

Podkreślić należy, że automatyczna budowa predykcyjnych modeli lasów losowych w rozbiciu na typu nieruchomości i segmenty w ramach tych typów, nie byłaby możliwa, gdyby nie obszerne zbiory danych transakcyjnych z okresu kilkunastu ostatnich lat, które są w posiadaniu firmy Cenatorium.

  • 1) Np. osobno miasto Warszawa oraz 6M – 6 dużych miast: Gdańsk, Gdynia, Kraków, Łódź, Poznań, Wrocław; 10M – 10 mniejszych ośrodków: Białystok, Bydgoszcz, Katowice, Kielce, Lublin, Olsztyn, Opole, Rzeszów, Szczecin, Zielona Góra
  • 2) Algorytm prezentowany w dokumencie jest uniwersalnym, może być wykorzystywany do konstrukcji indeksów cen zarówno na rynku pierwotnym i wtórnym.
  • 3) autorzy mają na uwadze, że dla każdego typu nieruchomości należy sklasyfikować odrębne zmienne przykładowo dla indeksu cen gruntów pod zabudowę należy rozważać zupełnie inne zmienne niż w przypadku lokali mieszkalnych choć i w tym wykorzystanie lasów losowych jest jak najbardziej uzasadnione.
  • 4) Leo Breiman (2001), Random Forests, Statistics Department University of California Berkeley, CA 94720
Barbara Bugaj, Starszy analityk rynku nieruchomości
+48 603 920 011
barbara.bugaj@cenatorium.pl

Powiązane wpisy

Please make sure that you have installed the Profile Builder plugin.