Kontroll av inverterad pendel med inlärning

Detta är en Kandidat-uppsats från KTH/Skolan för teknikvetenskap (SCI)

Författare: Måns Rasmussen; Gustaf Holte; [2019]

Nyckelord: ;

Sammanfattning: Den inverterade pendeln fäst på en vagn som kan röra sig längs en riktning, även kallad CartPole, anses vara det mest grundläggande exemplet inom reglerteknik och optimering. I denna rapport var målet att försöka lösa detta instabila, olinjära stabiliseringsproblemet med hjälp av maskininlärning, mer specifikt med ett artificiellt neuronnät. I början av varje simulation ändrades vagnens massa samt pendelns massa och längd slumpmässigt. Dessutom undersöktes hur robust modellen var, genom att ta reda på hur långt man kunde ändra CartPole parametrarna utanför de gränser som modellen har tränats för. Detta uppnåddes genom att göra tusentals simuleringar, allt kodat i Python med paket som TFLearn, Tensorflow och gym från openAI. Resultaten visade att det faktiskt är möjligt att kontrollera CartPole-systemet med hjälp av ett neuronnät, samt visade att det är en robust modell som klarar av nya CartPole parametrar som går långt utanför det område som neuronnätet hade tränats för.  

  HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)