Interpolated Policy Gradient: Merging On-Policy and Off-Policy Gradient 
Estimation for Deep Reinforcement Learning

Gu, S.; Lillicrap, T.; Turner, R. E.; Ghahramani, Z.; Schölkopf, B; Levine, S.

Datensatz

DATENSATZ AKTIONENEXPORT

Zur Ablage hinzufügen

Bitte beachten Sie, dass eine neuere Version dieses Datensatzes verfügbar ist:
https://pure.mpg.de/pubman/item/item_2564855_11

DetailsÜbersicht

Interpolated Policy Gradient: Merging On-Policy and Off-Policy Gradient Estimation for Deep Reinforcement Learning

Gu, S., Lillicrap, T., Turner, R. E., Ghahramani, Z., Schölkopf, B., & Levine, S. (2017). Interpolated Policy Gradient: Merging On-Policy and Off-Policy Gradient Estimation for Deep Reinforcement Learning. In I. Guyon, U. von Luxburg, S. Bengio, H. Wallach, R. Fergus, S. Vishwanathan, et al. (Eds.), Advances in Neural Information Processing Systems 30 (pp. 3849-3858). Curran Associates, Inc. Retrieved from https://papers.nips.cc/paper/6974-interpolated-policy-gradient-merging-on-policy-and-off-policy-gradient-estimation-for-deep-reinforcement-learning.pdf.

Item is Freigegeben

einblenden: alle ausblenden: alle

Basisdaten

einblenden: ausblenden:

Datensatz-Permalink: https://hdl.handle.net/21.11116/0000-0000-FEA0-D Versions-Permalink: https://hdl.handle.net/21.11116/0000-0000-FEA1-C

Genre: Konferenzbeitrag

Dateien

einblenden: Dateien

Externe Referenzen

einblenden:

ausblenden:

externe Referenz:
Link (beliebiger Volltext) Open Access Status unbekannt

Beschreibung:
-

OA-Status:

Urheber

einblenden:

ausblenden:

Urheber:
Gu, S.¹, Autor
Lillicrap, T.², Autor
Turner, R. E.², Autor
Ghahramani, Z.², Autor
Schölkopf, B¹, Autor
Levine, S.², Autor

Affiliations:
1Dept. Empirical Inference, Max Planck Institute for Intelligent Systems, Max Planck Society, ou_1497647
2External Organizations, ou_persistent22

Inhalt

einblenden:

ausblenden:

Schlagwörter: Abt. Schölkopf

Zusammenfassung: -

Details

einblenden:

ausblenden:

Sprache(n): eng - English

Datum: Online veröffentlicht: 2017-12

Publikationsstatus: Online veröffentlicht

Seiten: -

Ort, Verlag, Ausgabe: -

Inhaltsverzeichnis: -

Art der Begutachtung: -

Identifikatoren: BibTex Citekey: Guetal17
URI: https://papers.nips.cc/paper/6974-interpolated-policy-gradient-merging-on-policy-and-off-policy-gradient-estimation-for-deep-reinforcement-learning.pdf

Art des Abschluß: -

Veranstaltung

einblenden:

ausblenden:

Titel: 31st Conference on Neural Information Processing Systems (NIPS 2017)

Veranstaltungsort: Long Beach, CA, USA

Start-/Enddatum: 2017-12-04 - 2017-12-09

ausblenden:

Titel: Advances in Neural Information Processing Systems 30

Genre der Quelle: Konferenzband

Urheber:
Guyon, I.¹, Herausgeber
von Luxburg, U.², Herausgeber
Bengio, S.¹, Herausgeber
Wallach, H.¹, Herausgeber
Fergus, R.¹, Herausgeber
Vishwanathan, S.¹, Herausgeber
Garnett, R.¹, Herausgeber

Affiliations:
1 External Organizations, ou_persistent22
2 Research Group Machines Learning Theory, Max Planck Institute for Intelligent Systems, Max Planck Society, ou_1497665

Ort, Verlag, Ausgabe: Curran Associates, Inc.

Seiten: - Band / Heft: 30 Artikelnummer: - Start- / Endseite: 3849 - 3858 Identifikator: URI: https://papers.nips.cc/book/advances-in-neural-information-processing-systems-30-2017

Datensatz

Basisdaten

Dateien

Externe Referenzen

Urheber

Inhalt

Details

Veranstaltung

Entscheidung

Projektinformation

Quelle 1