Sökning: "Markov Decision Process"

Visar resultat 11 - 15 av 24 uppsatser innehållade orden Markov Decision Process.

  1. 11. Probabilistic Least-violating Control Strategy Synthesis with Safety Rules

    Kandidat-uppsats, KTH/Skolan för elektroteknik och datavetenskap (EECS); KTH/Skolan för elektroteknik och datavetenskap (EECS)

    Författare :Ludvig Janiuk; Johan Sjölén; [2018]
    Nyckelord :;

    Sammanfattning : We consider the problem of automatic control strategy synthesis for discrete models of robotic systems, where the goal is to travel from some region to another while obeying a given set of safety rules in an environment with uncertain properties. This is a probabilistic extension of the work by Jana Tumová et al. LÄS MER

  2. 12. Optimized Trade Execution with Reinforcement Learning

    Master-uppsats, Linköpings universitet/Institutionen för datavetenskap; Linköpings universitet/Institutionen för datavetenskap

    Författare :Olle Dahlén; Axel Rantil; [2018]
    Nyckelord :Reinforcement Learning; Deep Learning; Trade Execution; Proximal Policy Optimization;

    Sammanfattning : In this thesis, we study the problem of buying or selling a given volume of a financial asset within a given time horizon to the best possible price, a problem formally known as optimized trade execution. Our approach is an empirical one. We use historical data to simulate the process of placing artificial orders in a market. LÄS MER

  3. 13. Designförslag på belöningsfunktioner för självkörande bilar i TORCS som inte krockar

    Kandidat-uppsats, Högskolan i Borås/Akademin för bibliotek, information, pedagogik och IT; Högskolan i Borås/Akademin för bibliotek, information, pedagogik och IT

    Författare :Björn Andersson; Felix Eriksson; [2018]
    Nyckelord :Machine learning; neural networks; self-driving cars; self-driving agent; reward function; Markov Decision Process; TORCS; maskininlärning; neurala nätverk; självkörande-bil; självkörande-agent; belöningsfunktioner; Markov Decision Process; TORCS;

    Sammanfattning : Den här studien använder sig av TORCS (The Open Racing Car Simulator) som är ett intressant spel att skapa självkörande bilar i då det finns nitton olika typer av sensorer som beskriver omgivningen för agenten. Problemet för denna studie har varit att identifiera vilka av alla dessa sensorer som kan användas i en belöningsfunktion och hur denna sedan skall implementeras. LÄS MER

  4. 14. Capturing continuous human movement on a linear network with mobile phone towers

    Master-uppsats, Umeå universitet/Institutionen för matematik och matematisk statistik

    Författare :Jesper Dejby; [2017]
    Nyckelord :Mobile phone tower analysis; Mobile phone networks; Spatial point processes; Linear networks; Call detail records; Human movement; Human trajectories; Markov decision processes; Continuous random walks;

    Sammanfattning : Anonymous Call Detail Records (CDR’s) from mobile phone towers provide a unique opportunity to aggregate individual location data to overall human mobility patterns. Flowminder uses this data to improve the welfare of low- and middle-income countries. The movement patterns are studied through key measurements of mobility. LÄS MER

  5. 15. Model Evaluation for Optimal HVAC in Residential NZEBs

    Master-uppsats, KTH/Energiteknik

    Författare :Farah Cheaib; [2016]
    Nyckelord :;

    Sammanfattning : Heating, Ventilation, and Air-Conditioning (HVAC) systems constitute a signicant portion of the total energy consumed in households. Changing the operation of the HVAC system can thus have signicant impact on the energy savings that a household can achieve. LÄS MER