Deutsch
 
Benutzerhandbuch Datenschutzhinweis Impressum Kontakt
  DetailsucheBrowse

Datensatz

DATENSATZ AKTIONENEXPORT

Freigegeben

Konferenzbeitrag

Q-Prop: Sample-Efficient Policy Gradient with An Off-Policy Critic

MPG-Autoren
/persons/resource/persons217894

Gu,  Shixiang
Dept. Empirical Inference, Max Planck Institute for Intelligent Systems, Max Planck Society;

Externe Ressourcen

Link
(beliebiger Volltext)

Volltexte (frei zugänglich)
Es sind keine frei zugänglichen Volltexte verfügbar
Ergänzendes Material (frei zugänglich)
Es sind keine frei zugänglichen Ergänzenden Materialien verfügbar
Zitation

Gu, S., Lillicrap, T., Ghahramani, Z., Turner, R. E., & Levine, S. (2017). Q-Prop: Sample-Efficient Policy Gradient with An Off-Policy Critic. In Proceedings International Conference on Learning Representations 2017. Amherst, MA: OpenReviews.net. Retrieved from https://openreview.net/pdf?id=SJ3rcZcxl.


Zitierlink: http://hdl.handle.net/21.11116/0000-0001-1ED0-3
Zusammenfassung
Es ist keine Zusammenfassung verfügbar