Klassificeringsmetoder med medicinska tillämpningar : En jämförande studie mellan logistisk regression, elastic net och random forest

Detta är en Kandidat-uppsats från Umeå universitet/Statistik

Författare: Gustaf Björk; Carlsson Tobias; [2016]

Nyckelord: ;

Sammanfattning: Idag genererar den medicinska forskningen mycket stora mängder data med en skiftande karaktär. Detta har gjort att statistiska klassificeringsmetoder blivit allt mer populära som beslutstöd inom medicinsk forskning och praktik. Den här uppsatsen försöker reda ut om någon av klassificeringsmetoderna logistisk regression, elastic net eller random forest presterar bättre än övriga metoder när datamaterialets förhållande mellan observationer och förklaringsvariabler varierar. Metodernas klassificeringsprestation utvärderas med hjälp av korsvalidering. Resultatet visar att metoderna presterar likvärdigt när datamaterialet består av fler observationer än förklaringsvariabler och även då datamaterialet innehåller fler förklaringsvariabler än observationer. Däremot presterar elastic net klart bättre än de övriga metoderna på det datamaterial där antalet observationer är ungefär lika som antalet förklaringsvariabler. Vidare tyder resultaten på att alla tre metoder med fördel kan användas på datamaterial med fler variabler än observationer vilket är vanligt för datamaterial som rör genetik. Detta givet att en manuell variabelselektion sker för logistisk regression för att metoden ska kunna appliceras i denna situation.

  HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)