Reinforcement Learning and Dynamic Programming Using Function Approximators

Name: Reinforcement Learning and Dynamic Programming Using Function Approximators
Brand: Taylor & Francis Ltd (Sales)
SKU: 9781439821084
Price: 107.49 EUR
Availability: InStock

-0 %

Lucian Busoniu

Taylor & Francis Ltd (Sales)

Besorgungstitel - wird vorgemerkt | Lieferzeit: Besorgungstitel - Lieferbar innerhalb von 10 Werktagen I

Unser bisheriger Preis:ORGPRICE: 107,50 €

Jetzt 107,49 €*

Alle Preise inkl. MwSt. | Versandkostenfrei

Artikel-Nr:

9781439821084

Veröffentl:

2010

Erscheinungsdatum:

29.04.2010

Seiten:

280

Autor:

Lucian Busoniu

Gewicht:

560 g

Format:

241x161x25 mm

Sprache:

Englisch

Beschreibung:

Robert Babuska, Lucian Busoniu, and Bart de Schutter are with the Delft University of Technology. Damien Ernst is with the University of Liege.

While Dynamic Programming (DP) has helped solve control problems involving dynamic systems, its value was limited by algorithms that lacked practical scale-up capacity. In recent years, developments in Reinforcement Learning (RL), DP's model-free counterpart, has changed this. Focusing on continuous-variable problems, this unparalleled work provides an introduction to classical RL and DP, followed by a presentation of current methods in RL and DP with approximation. Combining algorithm development with theoretical guarantees, it offers illustrative examples that readers will be able to adapt to their own work.

Introduction. Dynamic programming and reinforcement learning. Focus of this book. Book outline. Basics of dynamic programming and reinforcement learning. Introduction. Markov decision processes. Value iteration. Policy iteration. Direct policy search. Conclusions. Bibliographical notes. Dynamic programming and reinforcement learning in large and continuous spaces. Introduction. The need for approximation in large and continuous spaces. Approximate value iteration. Approximate policy iteration. Finding value function approximators automatically. Approximate policy search. Comparison of approximate value iteration, policy iteration, and policy search. Conclusions. Bibliographical notes. Q-value iteration with fuzzy approximation. Introduction. Fuzzy Q-iteration. Analysis of fuzzy Q-iteration. Optimizing the membership functions. Experimental studies. Conclusions. Bibliographical notes. Online and continuous-action least-squares policy iteration. Introduction. Least-squares policy iteration. LSPI with continuous-action approximation. Online LSPI. Using prior knowledge in online LSPI. Experimental studies. Conclusions. Bibliographical notes. Direct policy search with adaptive basis functions. Introduction. Policy search with adaptive basis functions. Experimental studies. Conclusions. Bibliographical notes. References. Glossary.

Kunden Rezensionen

Zu diesem Artikel ist noch keine Rezension vorhanden.
Helfen sie anderen Besuchern und verfassen Sie selbst eine Rezension.

> neue Rezension schreiben

Reinforcement Learning and Dynamic Programming Using Function Approximators

Beschreibung:

Kunden Rezensionen

Kontakt

Ihre Vorteile bei uns

Zahlweisen

Versandarten

Herzlich Willkommen!

Notwendige Cookies

Komfort Cookies

Marketing-/ Tracking-Cookies

Reinforcement Learning and Dynamic Programming Using Function Approximators

Beschreibung:

Kunden Rezensionen