Enhancing House Rental Price Prediction Models for the Swedish Market : Exploring External features, Prediction intervals and Uncertainty Management in Predicting House Rental Prices

Detta är en Master-uppsats från KTH/Skolan för elektroteknik och datavetenskap (EECS)

Författare: Vasigaran Senthilkumar; [2023]

Nyckelord: ;

Sammanfattning: Exakt förutsägelse av hyrespriserna för hus är ett avgörande problem i verkligheten fastighetsdomän, vilket underlättar informerat beslutsfattande för både hyresgäster och hyresvärdar. Denna studie presenterar en omfattande utforskning av olika maskininlärningstekniker som tillämpas på en mångsidig datauppsättning av husfunktioner, med det övergripande målet att avslöja den mest effektiva algoritmen för förutsäga hyrespriser. Genom rigorösa experimenterande och noggranna analys, strävar vi efter att ge insikter om styrkor, begränsningar och praktiska implementeringsmöjligheter för olika modeller inom dynamiken förutsägelser om husuthyrning. Att träna effektiva modeller relevanta funktioner extraheras från databasen och olika funktionsteknikmetoder är utförs som kan vara avgörande för att förbättra modellens kvalitet. Uppgifterna som användes i studien baserades på undertecknade huskontrakt och osignerade hus ansökningar inkomna på onlinebostadsplattformen Qasa. Studien analyserar den prediktiva förmågan hos XGBoost- och CatBoost-modellerna. Senare hyperparameterinställning gav betydande förbättringar, med lägre RMSE poäng. Extern funktion som eventuellt kan påverka priset på hyran som promenadpoäng, polarkoordinater och räntor ingår i dataset från tredje parts API:er. Studien visar att lägga till dessa funktioner introducerar komplexitet, vilket leder till både marginella ökningar av baslinjemodeller RMSE-värden och betydande förbättringar efter justering av hyperparameter. Vår undersökningen omfattar också konstruktion och analys av förutsägelser intervaller som förutsäger möjliga hyresintervall, vilket understryker vikten av fångar verklig osäkerhet korrekt. Utförandet av tre olika metoder för att beräkna prediktionsintervall analyseras och jackkniven plus-metoden uppnår konsekvent de högsta täckningspoängen, vilket indikerar dess förmåga att exakt fånga verkliga observationsområden. Avhandlingen undersöker hur kombinationen av ett dataset med viss hyra värden och en datauppsättning med osäkra hyresvärden kan införlivas i byggnaden en prisprediktionsmodell. Olika tillvägagångssätt såsom källinformation särdragsmetod , tillvägagångssätt för säkerheten, aggregerade egenskapsegenskaper, och KNN-baserad tillvägagångssätt för egenskapslikhet utvärderas för att visa modellers anpassningsförmåga till osäkerhet och prioritering av generalisering

  HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)