Tolkning av handskrivna siffror i formulär : Betydelsen av datauppsättningens storlek vid maskininlärning

Detta är en Kandidat-uppsats från Mittuniversitetet/Institutionen för informationssystem och –teknologi

Författare: Engin Kirik; [2021]

Nyckelord: Machine learning; Neural networks; Object recognition; TensorFlow; PyTorch; CPU; GPU; Maskininlärning; Neurala nätverk; Objektigenkänning; TensorFlow; PyTorch; CPU; GPU;

Sammanfattning: Forskningen i denna studie har varit att tag fram hur mycket betydelse storleken på datauppsättningen har för inverkan på resultat inom objektigenkänning. Forskningen implementerades i att träna en modell inom datorseende som skall kunna identifiera och konvertera handskrivna siffror från fysisk-formulär till digitaliserad-format. Till denna process användes två olika ramverk som heter TensorFlow och PyTorch. Processen tränades inom två olika miljöer, ena modellen tränades i CPU-miljö och den andra i Google Clouds GPU-miljö. Tanken med studien är att förbättra resultat från tidigare examensarbete och forska vidare till att utöka utvecklingen extra genom att skapa en modell som identifierar och digitaliserar flera handskrivna siffror samtidigt på ett helt formulär. För att vidare i fortsättningen kunna användas till applikationer som räknar ihop tex poängskörden på ett formulär med hjälp av en mobilkamera för igenkänning. Projektet visade ett resultat av ett felfritt igenkännande av flera siffror samtidigt, när datauppsättningen ständigt utökades. Resultat kring enskilda siffror lyckades identifiera alla siffror från 0 till 9 med både ramverket TensorFlow och PyTorch.

HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)

Tolkning av handskrivna siffror i formulär : Betydelsen av datauppsättningens storlek vid maskininlärning

Sökningar just nu

Populära sökningar

Uppsatser med många visningar igår (2024-04-25)