Jämförelse av noggrannhet mellan tre maskininlärningsmodeller på väderdata

Detta är en Kandidat-uppsats från KTH/Skolan för elektroteknik och datavetenskap (EECS)

Författare: Alexander Falk; Johan Maseng; [2023]

Nyckelord: ;

Sammanfattning: Väderprognoser har varit ett hett ämne och forskningsområde under de senaste årtiondena. Matematikern och meteorologen Edward Lorenz, lade grunden till den moderna teorin bakom väderprognoser och grundade den moderna kaosteorin som beskriver väderförhållanden som ett kaotiskt system. Moderna väderprognoser görs med hjälp av system av differentialekvationer som är känsliga för störningar med hänvisning till kaosteorin. Tidigare studier har visat att maskininlärning är ett användbart verktyg för väderprognoser och att modeller för maskininlärning i allmänhet är mindre känsliga för störningar. Därför syftar denna forskning till att undersöka förutsägbarheten av den genomsnittliga lufttemperaturen i Stockholm med hjälp av tre olika modeller för maskininlärning. De modeller som används för förutsägelser är linjär-, random forest- och MLP-regression. De olika modellerna tränas på data korrelerat till lufttemperatur som samlats in av SMHI på väderstationen vid Bromma flygplats. Datan används sedan för att förutsäga den genomsnittliga lufttemperaturen en, sju och trettio dagar framåt i tiden, följt av jämförelser av resultaten för de olika modellerna för att dra slutsatsen vilken av de tre modellerna som är att föredra vid väderprognoser med denna typ av data. Generellt visar resultaten att noggrannheten i temperaturförutsägelserna var bättre på kort sikt än på lång sikt, vilket stödjer sig av den kaosteori som Edward Lorenz föreslår. Resultaten visar också att MLP-regressionen hade den bästa noggrannheten för kortare tidsperioder (1 och 7 dagar) medan linjär regression hade den bästa noggrannheten för längre tidsperioder (30 dagar) vilket tyder på att MLP-regression är mer lämplig för att förutse temperatur i snar framtid medan linjär regression är mer lämplig för att förutse temperatur långt fram i tiden. Trots att slutsatsen visar att de jämförda modellerna i dagsläget inte kan ersätta de moderna modellerna med differentialekvationer, finns det fortfarande motiv att forska vidare inom detta område eftersom det existerar en myriad andra modeller för maskininlärning med många olika optimeringsmöjligheter för förutsägelser av väderleksförhållanden.

  HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)