Utvärdering av maskininlärningsmodeller vid konkursprediktion

Detta är en Kandidat-uppsats från KTH/Skolan för elektroteknik och datavetenskap (EECS)

Författare: Mikaela Jansson; Katarina Ölander Gür; [2021]

Nyckelord: ;

Sammanfattning: Att identifiera finansiella svårigheter vid bedömning av ett företags ekonomiska situation är väsentligt för att kreditgivare ska undvika kreditförluster. En viktig del av kreditbedömningen är att analysera sannolikheten för att ett företag kommer gå i konkurs eller inte. Att identifiera en förhöjd konkursrisk ar därmed en faktor som kan hjälpa kreditgivare att fatta mer varsamma investeringsbeslut. Arbetet ämnar därför att undersöka hur väl fyra olika maskininlärningsalgoritmer kan predicera okad risk för konkurs utifrån finansiell bolagsdata. Modellerna som används är logistisk regression, Support Vector Machine, Decision Trees och Random Forest. Då datan var obalanserad där antalet icke-konkurser var överrepresenterad fick modellerna tränas och testas på flera olika fördelade dataset och de slutgiltiga resultaten bygger på ett dataset som är balanserat. Modellerna utvärderades med hjälp av en förväxlingsmatris och evalueringsmatten korrekthet, precision, täckning och F-score. Ju mer balanserad datan blev desto bättre blev resultaten men trots detta skiljde sig resultaten mellan modellerna. Studien visade att logistisk regression presterade sämst av samtliga modeller med ett F-score på 60%. Random Forest var den modell som hade bast prediktiv förmåga med ett F-score på 77%. Vid studerande av särdragen visade det sig bland annat att förändring i antalet anställda, soliditet och eget kapital har en förklaringsgrad till konkurs och är något som bör tas i beaktande vid kreditbedömning. Andra faktorer, såsom vilken industri ett företag tillhör, bör även det ha en betydelse vid kreditbedömning då olika branscher tenderar att ha fler konkurser än andra.  

  HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)