Simulering av system med flera agenter genom användande av djup förstärkande inlärning

Detta är en Kandidat-uppsats från KTH/Skolan för teknikvetenskap (SCI); KTH/Skolan för teknikvetenskap (SCI)

Författare: Petter Eriksson; Daniel Dalbom; [2019]

Nyckelord: ;

Sammanfattning: Förstärkande inlärning har fått mycket uppmärksamhet under de senaste åren, främst genom att det används för att lära datorer för att spela video- och brädspel. I denna rapport undersöks hur väl algoritmer från detta område kan användas för att lösa ett problem med flera agenter. Problemet med flera agenter som ska lösas är att lära robotar hur man kan transportera föremål genom ett lager utan att kollidera. En Q-learning-baserad algoritm föreslås för att lösa problemet. På grund av problem med skalbarhet föreslås också en DQN-baserad algoritm. Problem med skalbarhet uppstår i system med högre komplexitet, i system som kännetecknas av flera agenter eller en stor miljö. Det visas att Q-learning misslyckas med att lära sig en bra strategi på rimlig tid. Simuleringar görs för att illustrera beteendet hos de föreslagna algoritmerna. Resultaten av simuleringarna tyder på att DQN klarar sig betydligt bättre jämfört med Q-learning när problemets dimensioner är större.  

  HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)