Bildklassificering med optimal transport: Wassersteinavstånd och klusteranalys

Detta är en Kandidat-uppsats från KTH/Skolan för teknikvetenskap (SCI)

Författare: Björn Bergquist; [2021]

Nyckelord: ;

Sammanfattning: Målet med denna studie var att förstå om och hur optimal transport kan användas för bildklassificering samt att identifiera metodens egenskaper vid denna tillämpning. Med framtagna Wassersteinavstånd var sedan målet att utföra en klusteranalys av datan med spektral klustring.Undersökningen utfördes på 100 bilder ur datasetet Fashion MNIST. Två kategorier ur datasetet valdes ut och ur dessa 50 bilder vardera. Med hjälp av ett Pythonbibliotek, Python Optimal Transport (POT), kunde Wassersteinavstånden mellan respektive bild beräknas med Pyhton. Med samtliga Wassersteinavstånd beräknade kunde sedan klusteranalysen utföras.Resultaten visar på att för den data som har analyserats presterar Wassersteinavståndet bättre än det välkända Euklidiska avståndet. Med två ingående kategorier med 50 bilder vardera fås två kluster utan några större avvikelser med 50 datapunkter i respektive kluster. Klusteranalysen visar på att detta inte inträffar när det Euklidiska avståndet används i stället för Wassersteinavståndet.Målen med studien är således uppfyllda och resultaten pekar på att optimal transport är en passande metod för bildklassificering. Dock, för att kunna stärka detta påstående ytterligare, behöver större mängder data analyseras.

  HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)