Predicting Student Performance Using Machine Learning: A Comparative Study Between Classification Algorithms

Detta är en Kandidat-uppsats från Mittuniversitetet/Institutionen för informationssystem och –teknologi

Sammanfattning: Forskningsfrågan i denna avhandling var att utvärdera och jämföra två ML-algoritmer som var Support Vector Machine (SVM) och Artificial Neural Network (ANN) i termer av noggrannhet, precision, återkallelse, f1-poäng och förutsägelse när de tränades för att klassificera binära datamängder. Datauppsättningen hämtades från Ladok och bestod av anonyma högskolestudenter från en mängd kurser. Algoritmerna kördes på TensorFlow med Keras som API och byggdes, tränades och kördes för utvärdering, allt på Google Colab. Källkoden skrevs i Python. Det icke-tekniska målet med studien var att försöka hitta ett förutsägelsemönster för studentprestationer och tillhandahålla ett tekniskt ramverktyg för att ge feedback till studenter och universitetsfakulteten. Forskningsfrågan delades upp i tre separata delfrågor. Den första var om ML-algoritmerna var ett lämpligt sätt att hitta dessa elevmönster och den kunskap man fick var att ja eftersom dessa algoritmer var lämpliga för den lilla datauppsättningsstorleken. Den andra handlade om hur man implementerar SVM och ANN och det löstes med TensorFlow med Keras API. Den tredje handlade om mängden som behövdes för att dra slutsatserna och förutsäga dessa algoritmer, och det fastställdes att storleken var tillräcklig på grund av att den tränade noggrannheten var högre än baslinjenoggrannheten i båda algoritmerna. Den huvudsakliga forskningsfrågan resulterade i att SVM-modellen överträffade ANN-modellen vad gäller alla nämnda parametrar. Detta teoretiserades på grund av att SVM har linjärt ökande multiparameter som matchade de ökade ingångarna. Detta var inte fallet med strukturen för ANN.

  HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)