Evaluation of Policy Gradient Methods and Variants on the Cart-Pole Benchmark

Riedmiller, M; Peters, J; Schaal, S

doi:10.1109/ADPRL.2007.368196

Datensatz

DATENSATZ AKTIONENEXPORT

DownloadE-Mail

Bitte beachten Sie, dass eine neuere Version dieses Datensatzes verfügbar ist:
https://pure.mpg.de/pubman/item/item_1790533_2

DetailsÜbersicht

Evaluation of Policy Gradient Methods and Variants on the Cart-Pole Benchmark

Riedmiller, M., Peters, J., & Schaal, S. (2007). Evaluation of Policy Gradient Methods and Variants on the Cart-Pole Benchmark. Proceedings of the 2007 IEEE Internatinal Symposium on Approximate Dynamic Programming and Reinforcement Learning (ADPRL 2007), 254-261.

Item is Freigegeben

einblenden: alle ausblenden: alle

Basisdaten

einblenden: ausblenden:

Datensatz-Permalink: https://hdl.handle.net/11858/00-001M-0000-0013-CE1B-8 Versions-Permalink: https://hdl.handle.net/11858/00-001M-0000-0013-CE1C-6

Genre: Konferenzbeitrag

ausblenden:

Urheber:
Riedmiller, M, Autor
Peters, J^{1, 2}, Autor
Schaal, S, Autor

Affiliations:
1Department Empirical Inference, Max Planck Institute for Biological Cybernetics, Max Planck Society, ou_1497795
2Dept. Empirical Inference, Max Planck Institute for Intelligent Systems, Max Planck Society, ou_1497647

Inhalt

einblenden:

ausblenden:

Schlagwörter: -

Zusammenfassung: In this paper, we evaluate different versions from the three main kinds of model-free policy gradient methods, i.e., finite difference gradients, ‘vanilla‘ policy gradients and natural policy gradients. Each of these methods is first presented in its simple form and subsequently refined and optimized. By carrying out numerous experiments on the cart pole regulator benchmark we aim to provide a useful baseline for future research on parameterized policy search algorithms. Portable C++ code is provided for both plant and algorithms; thus, the results in this paper can be reevaluated, reused and new algorithms can be inserted with ease.

Details

einblenden:

ausblenden:

Sprache(n):

Datum: Erschienen: 2007-04

Publikationsstatus: Erschienen

Seiten: -

Ort, Verlag, Ausgabe: -

Inhaltsverzeichnis: -

Art der Begutachtung: -

Identifikatoren: URI: http://liu.ece.uic.edu/ADPRL07/
DOI: 10.1109/ADPRL.2007.368196
BibTex Citekey: 4727

Art des Abschluß: -

Veranstaltung

einblenden:

ausblenden:

Titel: 2007 IEEE Internatinal Symposium on Approximate Dynamic Programming and Reinforcement Learning

Veranstaltungsort: Honolulu, Hawaii

Start-/Enddatum: -

Entscheidung

einblenden:

Projektinformation

einblenden:

Quelle 1

einblenden:

ausblenden:

Titel: Proceedings of the 2007 IEEE Internatinal Symposium on Approximate Dynamic Programming and Reinforcement Learning (ADPRL 2007)

Genre der Quelle: Zeitschrift

Urheber:

Affiliations:

Ort, Verlag, Ausgabe: Los Alamitos, CA, USA : IEEE Computer Society

Seiten: - Band / Heft: - Artikelnummer: - Start- / Endseite: 254 - 261 Identifikator: -

Datensatz

Basisdaten

Dateien

Externe Referenzen

Urheber

Inhalt

Details

Veranstaltung

Entscheidung

Projektinformation

Quelle 1