Om imputationsmetoder i statistisk analys : En simuleringsstudie om bortfallshantering och påverkan i en regressionsanalys

Detta är en Kandidat-uppsats från Uppsala universitet/Statistiska institutionen; Uppsala universitet/Statistiska institutionen

Sammanfattning: Bortfall är ett vanligt problem vid genomförandet av statistiska analyser. Studien undersöker hur val av metod för bortfallshantering påverkar en regressionsanalys estimerad från ett dataset med slumpmässigt saknad data. Genom simulerad data och en Monte Carlo-simulation har resultaten jämförts utifrån olika storlekar på bortfall. De saknade värdena har hanterats med fem metoder; imputationer med medelvärde, stokastisk regression, random forest, predictive mean matching (PMM) samt estimation med complete case analysis (CCA). Bortfallshanteringen utvärderas genom modellernas goodness of fit och betakoefficientens bias. Studien visar att CCA och imputering med stokastisk regression, random forest och PMM kan estimera betakoefficienten utan bias men att det ökar med större andel bortfall, vidare påverkas risken för att begå ett typ I-fel.

  HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)