Sökning: "OpenAI Gym"

Hittade 5 uppsatser innehållade orden OpenAI Gym.

  1. 1. Training reinforcement learning model with custom OpenAI gym for IIoT scenario

    Kandidat-uppsats, Mittuniversitetet/Institutionen för informationssystem och –teknologi

    Författare :Pontus Norman; [2022]
    Nyckelord :Q-learning. Reinforcement Learning; OpenAI gym; Q-learning. Reinforcement Learning; OpenAI gym;

    Sammanfattning : Denna studie består av ett experiment för att se, som ett test, hur bra det skulle fungera att implementera en industriell gymmiljö för att träna en reinforcement learning modell. För att fastställa det här tränas modellen upprepade gånger och modellen testas. LÄS MER

  2. 2. Implementing an OpenAI Gym for Machine Learning of Microgrid Electricity Trading

    Kandidat-uppsats, Mittuniversitetet/Institutionen för informationssystem och –teknologi

    Författare :André Lundholm; [2021]
    Nyckelord :Q-learning; Microgrids; Python; Neural networks; OpenAI Gym; Q-learning; Mikronät; Python; Neurala nätverk; OpenAI Gym;

    Sammanfattning : Samhället går idag bort från centraliserad energi mot decentraliserade system. Istället för att köpa från stora företag som skapar el från fossila bränslen har många förnybara alternativ kommit. Eftersom konsumenter kan generera solenergi med solpaneler kan de också bli producenter. LÄS MER

  3. 3. Generation and Detection of Adversarial Attacks for Reinforcement Learning Policies

    Kandidat-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Författare :Axel Drotz; Markus Hector; [2021]
    Nyckelord :Deep Reinforcement Learning; Adversarial Attacks; Adversarial Attack Detection; Fast Gradient Sign Method; Deep Deterministic Policy Gradient; Deep Q-Learning; Likelihood Ratio Test; CUSUM;

    Sammanfattning : In this project we investigate the susceptibility ofreinforcement rearning (RL) algorithms to adversarial attacks.Adversarial attacks have been proven to be very effective atreducing performance of deep learning classifiers, and recently,have also been shown to reduce performance of RL agents. LÄS MER

  4. 4. Reinforcement Learning Methods for OpenAI Environments

    Kandidat-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Författare :Andreas Winberg; Oliver Öhrstam Lindström; [2020]
    Nyckelord :Reinforcement learning; Q-learning; OpenAIgym; neural networks;

    Sammanfattning : Using the powerful methods developed in the fieldof reinforcement learning requires an understanding of theadvantages and drawbacks of different methods as well as theeffects of the different adjustable parameters. This paper high-lights the differences in performance and applicability betweenthree different Q-learning methods: Q-table, deep Q-network anddouble deep Q-network where Q refers to the value assigned toa given state-action pair. LÄS MER

  5. 5. Kontroll av inverterad pendel med inlärning

    Kandidat-uppsats, KTH/Skolan för teknikvetenskap (SCI)

    Författare :Måns Rasmussen; Gustaf Holte; [2019]
    Nyckelord :;

    Sammanfattning : Den inverterade pendeln fäst på en vagn som kan röra sig längs en riktning, även kallad CartPole, anses vara det mest grundläggande exemplet inom reglerteknik och optimering. I denna rapport var målet att försöka lösa detta instabila, olinjära stabiliseringsproblemet med hjälp av maskininlärning, mer specifikt med ett artificiellt neuronnät. LÄS MER