Intäktsestimering med hjälp av Maskininlärning

Detta är en Kandidat-uppsats från KTH/Skolan för elektroteknik och datavetenskap (EECS)

Författare: Arvid Holmäng; Axel Von Grothusen; [2021]

Nyckelord: ;

Sammanfattning: Detta arbete undersöker möjligheten att estimera intäkter för företag med hjälp av maskininlärning. Datan som modellerna utgår ifrån består av punkter från bolagens balansräkningar och annan offentlig data. Eftersom frågeställningen som arbetet utreder ar outforskad sedan tidigare ligger arbetets huvudsakliga fokus på att utforska vilka metoder som är mest lämpliga för uppgiften samt vilka särdrag i datasetet som har störst inverkan på modellerna. I arbetet utreds frågan med hjälp av fyra olika modeller; Random Forest regression, XGBoost, Minstakvadratmetoden och Lasso. Modellerna utvärderades med kvantitativa mättal såsom R2-varde och absoluta genomsnittliga procentuella felet (MAPE). Den algoritm och slutgiltiga modell som presterade bast utifrån dessa mått var Random Forest regression med genomsnittligt R2-score på 0,8197 och MAPE-score på 0.3864. Denna studie drar slutsatsen att ensemble metoder som XGBoost och Random Forest troligtvis ar mer lämpliga att använda för denna typ av studier i jämförelse med simplare regressionsmodeller såsom Minstakvadratmetoden och Lasso. Avslutningsvis dras slutsatsen att modellerna kan bidra till beslutsunderlaget vid utvärdering av bolag för vilka intäkterna är ok ända.

  HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)