Sökning: "imitationsinlärning"

Visar resultat 1 - 5 av 6 uppsatser innehållade ordet imitationsinlärning.

  1. 1. Continual imitation learning: Enhancing safe data set aggregation with elastic weight consolidation

    Master-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Författare :Andreas Elers; [2019]
    Nyckelord :Elasticweight consolidation; SafeDAGGER; DAGGER; Rehearsal buffer; Self-driving vehicle; Continual learning; Elastisk viktkonsolidering; SafeDAGGER; DAGGER; Repeteringsbuffert; Självkörande fordon; Stegvis inlärning;

    Sammanfattning : The field of machine learning currently draws massive attention due to ad- vancements and successful applications announced in the last few years. One of these applications is self-driving vehicles. A machine learning model can learn to drive through behavior cloning. Behavior cloning uses an expert’s behavioral traces as training data. LÄS MER

  2. 2. Performance Evaluation of Imitation Learning Algorithms with Human Experts

    Kandidat-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS); KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Författare :Erik Båvenstrand; Jakob Berggren; [2019]
    Nyckelord :Imitation Learning; DAGGER; HG-DAGGER; Behavior Cloning; Machine Learning; TORCS; Imitationsinlärning; DAGGER; HG-DAGGER; Behavior Cloning; Maskininlärning; TORCS;

    Sammanfattning : The purpose of this thesis was to compare the performance of three different imitation learning algorithms with human experts, with limited expert time. The central question was, ”How should one implement imitation learning in a simulated car racing environment, using human experts, to achieve the best performance when access to the experts is limited?”. LÄS MER

  3. 3. Reinforcement Learning with Imitation for Cavity Filter Tuning : Solving problems by throwing DIRT at them

    Master-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Författare :Simon Lindståhl; [2019]
    Nyckelord :;

    Sammanfattning : Cavity filters are vital components of radio base stations and networks.After production, they need tuning, which has proven to be a difficultprocess to do manually and even more so to automate. LÄS MER

  4. 4. Flying High: Deep Imitation Learning of Optimal Control for Unmanned Aerial Vehicles

    Master-uppsats, KTH/Robotik, perception och lärande, RPL

    Författare :Ludvig Ericson; [2018]
    Nyckelord :imitation learning; deep learning; neural networks; quadrotor; quadcopter; multicopter; multirotor; uav; mav; dagger; dynamics; physical dynamics; simulation; djupinlärning; neuronnät; kvadrotor; multikopter; simulation;

    Sammanfattning : Optimal control for multicopters is difficult in part due to the low processing power available, and the instability inherent to multicopters. Deep imitation learning is a method for approximating an expert control policy with a neural network, and has the potential of improving control for multicopters. LÄS MER

  5. 5. Barns lek : - En studie om hur barn i 1-2-års åldern använder sin erfarenhet av styrd lek i den fria leken.

    Uppsats för yrkesexamina på grundnivå, Linnéuniversitetet/Institutionen för pedagogik, psykologi och idrottsvetenskap, PPI

    Författare :Carina Boström; [2012]
    Nyckelord :Barn; Lek; Imitationsinlärning; Instruktionsinlärning; samarbete.;

    Sammanfattning : Barns lek i styrd lek och fri lek är intressant för alla som arbetar med barn eller bara är intresserade av barns utveckling. Leken är de små barnens sätt att upptäcka och utforska sin värld. LÄS MER