Deutsch
 
Hilfe Datenschutzhinweis Impressum
  DetailsucheBrowse

Datensatz

DATENSATZ AKTIONENEXPORT
  Hierarchical Relative Entropy Policy Search

Daniel, C., Neumann, G., & Peters, J. (2012). Hierarchical Relative Entropy Policy Search. In N. Lawrence, & M. Girolami (Eds.), Artificial Intelligence and Statistics, 21-23 April 2012, La Palma, Canary Islands (pp. 273-281). Madison, WI, USA: International Machine Learning Society.

Item is

Externe Referenzen

einblenden:
ausblenden:
externe Referenz:
http://proceedings.mlr.press/v22/daniel12/daniel12.pdf (Verlagsversion)
Beschreibung:
-
OA-Status:

Urheber

einblenden:
ausblenden:
 Urheber:
Daniel, C, Autor
Neumann, G, Autor
Peters, J1, Autor           
Affiliations:
1Dept. Empirical Inference, Max Planck Institute for Intelligent Systems, Max Planck Society, ou_1497647              

Inhalt

einblenden:
ausblenden:
Schlagwörter: -
 Zusammenfassung: Many real-world problems are inherently hi- erarchically structured. The use of this struc- ture in an agent's policy may well be the key to improved scalability and higher per- formance. However, such hierarchical struc- tures cannot be exploited by current policy search algorithms. We will concentrate on a basic, but highly relevant hierarchy - the 'mixed option' policy. Here, a gating network first decides which of the options to execute and, subsequently, the option-policy deter- mines the action. In this paper, we reformulate learning a hi- erarchical policy as a latent variable estima- tion problem and subsequently extend the Relative Entropy Policy Search (REPS) to the latent variable case. We show that our Hierarchical REPS can learn versatile solu- tions while also showing an increased perfor- mance in terms of learning speed and quality of the found policy in comparison to the non- hierarchical approach.

Details

einblenden:
ausblenden:
Sprache(n):
 Datum: 2012-04
 Publikationsstatus: Erschienen
 Seiten: -
 Ort, Verlag, Ausgabe: -
 Inhaltsverzeichnis: -
 Art der Begutachtung: -
 Identifikatoren: BibTex Citekey: DanielNP2012
 Art des Abschluß: -

Veranstaltung

einblenden:
ausblenden:
Titel: Fifteenth International Conference on Artificial Intelligence and Statistics (AI Statistics 2012)
Veranstaltungsort: La Palma, Canary Islands, Spain
Start-/Enddatum: 2012-04-21 - 2012-04-23

Entscheidung

einblenden:

Projektinformation

einblenden:

Quelle 1

einblenden:
ausblenden:
Titel: Artificial Intelligence and Statistics, 21-23 April 2012, La Palma, Canary Islands
Genre der Quelle: Konferenzband
 Urheber:
Lawrence, N, Herausgeber
Girolami, M, Herausgeber
Affiliations:
-
Ort, Verlag, Ausgabe: Madison, WI, USA : International Machine Learning Society
Seiten: - Band / Heft: - Artikelnummer: - Start- / Endseite: 273 - 281 Identifikator: -

Quelle 2

einblenden:
ausblenden:
Titel: JMLR Workshop and Conference Proceedings
Genre der Quelle: Reihe
 Urheber:
Affiliations:
Ort, Verlag, Ausgabe: -
Seiten: - Band / Heft: 22 Artikelnummer: - Start- / Endseite: - Identifikator: -