Mönster som leder till sjukfrånvaro : Sekvensanalys på longitudinella data

Detta är en Kandidat-uppsats från Linköpings universitet/Statistik och maskininlärning

Sammanfattning: Sjukfrånvaro innebär en kostnad för både arbetsgivare och arbetstagare. För en anonym fullgrossist är detta ett problem på en av deras lagerlokaler, där sjukfrånvaron är hög. Uppsatsen syftar till att identifiera intressanta mönster över tid som leder till sjukfrånvaro genom att analysera data från företagets lönesystem och tidssystem. Datamaterialet är longitudinellt och för att upptäcka mönster som leder till sjukfrånvaro används sekvensanalys. För att generera de sekventiella mönstren används algoritmen cSPADE då den möjliggör att tidsbegränsningar kan anges för sekvenserna. Relevansen hos de genererade sekvenserna utvärderas med tre intressemått: support, konfidens och lift. Tre separata analyser genomförs där olika antal variabler används, beroende på om de förändras över tid eller har ett konstant värde, och för dessa analyser aggregeras data veckovis. De vanligaste händelserna som leder till sjukfrånvaro hos expeditörer är olika anställningstider, kön och födelseår. Några dagars sjukfrånvaro under en vecka, det vill säga mellan 8 och 40 timmar, är mer förekommande bland expeditörerna jämfört med kortare respektive längre sjukfrånvaro. Det går att konstatera att mönster med tidigare sjukfrånvaro ofta leder till fortsatt sjukfrånvaro. Uppsatsen belyser även de problem som uppstår inom sekvensanalys, till exempel att konstanta variabler överskuggar de icke-konstanta variablerna i de genererade sekvenserna. Detta händer när variabler som förändras över tiden används i kombination med variabler som har konstanta värden, något som kan förekomma i longitudinella datamaterial.

  HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)