Maskininlärningsmetoder tillämpade på StarCraft 2 - En undersökning av reinforcement och imitation learning

Detta är en Kandidat-uppsats från Göteborgs universitet/Institutionen för data- och informationsteknik

Sammanfattning: Inom artificiell intelligens, som kontinuerligt utvecklas, har maskininlärning tagit en centralroll. Medan regelbaserad AI varit tillräcklig för att lösa grundläggande uppgifter behöverdagens utmaningar mer avancerade metoder. Arbetet undersöker olika tekniker föratt utveckla avancerad artificiell intelligens till spelet StarCraft 2, och jämför dem motvarandra. Totalt utvecklades tre agenter. De första två baserades på en reinforcementlearning-metod kallad Advantage Actor Critic (A2C) där den andra även inkluderade imitationav en interaktiv expertpolicy. Den tredje var en behavioral cloning-agent (BC), somär en sorts imitation learning, tränad på en datamängd förgenererad av en expertpolicy.A2C med imitation resulterade i den högsta vinstandelen på 73;4% mot den svårainbyggda AI:n medan BC-agenten enbart uppnådde en vinstandel på 17 %. Den grundläggandeA2C-agenten kunde enbart vinna mot den mycket lätta AI:n. Slutsatsen är attde agenter som använde sig av imitation learning presterade bättre än den som enbart användereinforcement learning, möjligtvis på grund av en otillräcklig implementering avA2C.

  HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)