Kombination av exempelbaserad och belöningsbaserad inlärning för ANN

Detta är en Kandidat-uppsats från Högskolan i Skövde/Institutionen för informationsteknologi

Sammanfattning: Det här experimentet gick ut på att testa tre olika inlärningsstrategier emot varandra i en spelmiljö. De tre inlärningsstrategier som testades var en exempelbaserad strategi, en belöningsbaserad strategi och en strategi som kombinerade dessa två algoritmer. Kombinationen bestod av att först träna upp ett nätverk med den exempelbaserade strategin för att sedan använda det nätverket som en utgångspunkt för den belöningsbaserade strategin. Dessa strategier testades sedan i en spelmiljö. Resultatet som de olika strategierna producerade var svårtolkade. På grund av att alla inlärningsstrategierna inte förbättrade sig märkvärdigt under deras träningstid har det gjort att resultaten från att ändra på variablerna hos de olika strategierna inte visat på några märkvärda skillnader i resultat. Skillnader i resultat vid jämförelser av de olika strategierna har observerats men det går inte att säkerställa att det är inlärningsstrategierna som är anledningen till skillnad i resultat.

  HÄR KAN DU HÄMTA UPPSATSEN I FULLTEXT. (följ länken till nästa sida)