Connecting Exploration, Generalization, and Planning in Correlated Trees

Ludwig, T; Wu, CM; Schulz, E

Lokale TagsFreigabegeschichteDetailsÜbersicht

Connecting Exploration, Generalization, and Planning in Correlated Trees

Ludwig, T., Wu, C., & Schulz, E. (2022). Connecting Exploration, Generalization, and Planning in Correlated Trees. In J. Culbertson, A. Perfors, H. Rabagliati, & V. Ramenzoni (Eds.), 44th Annual Meeting of the Cognitive Science Society (CogSci 2022): Cognitive Diversity (pp. 2940-2946).

Item is Freigegeben

einblenden: alle ausblenden: alle

Basisdaten

einblenden: ausblenden:

Datensatz-Permalink: https://hdl.handle.net/21.11116/0000-000A-0825-4 Versions-Permalink: https://hdl.handle.net/21.11116/0000-000E-6BED-0

Genre: Konferenzbeitrag

Dateien

einblenden: Dateien

Externe Referenzen

einblenden:

ausblenden:

externe Referenz:
https://escholarship.org/content/qt6xx6684w/qt6xx6684w.pdf?t=reckpb (Verlagsversion) Open Access Status unbekannt

Beschreibung:
-

OA-Status:
Keine Angabe

Urheber

einblenden:

ausblenden:

Urheber:
Ludwig, T¹, Autor
Wu, CM², Autor
Schulz, E¹, Autor

Affiliations:
1Research Group Computational Principles of Intelligence, Max Planck Institute for Biological Cybernetics, Max Planck Society, ou_3189356
2Institutional Guests, Max Planck Institute for Biological Cybernetics, Max Planck Society, ou_3505519

Inhalt

einblenden:

ausblenden:

Schlagwörter: -

Zusammenfassung: Human reinforcement learning (RL) is characterized by different challenges. Exploration has been studied extensively in multi-armed bandits, while planning has been investigated in multi-step decision tasks. More recent work added structure >to bandits to study generalization. However, most studies focus on a single aspect of learning, making it hard to compare and integrate results. Here, we propose a generative model for constructing Correlated Trees, which provide a unified and scalable method for studying exploration, planning, and generalization in a single task. In an online experiment, we found that, when provided, people use structure to generalize and perform uncertainty-directed exploration, with structure helping more in larger environments. In environments without structure, exploration becomes more random and more planning is needed. All behavioral effects are captured in a single model with recoverable parameters. In conclusion, our results connect past research on human RL in one framework using Correlated Trees.

Details

einblenden:

ausblenden:

Sprache(n):

Datum: Online veröffentlicht: 2022-07

Publikationsstatus: Online veröffentlicht

Seiten: -

Ort, Verlag, Ausgabe: -

Inhaltsverzeichnis: -

Art der Begutachtung: -

Identifikatoren: -

Art des Abschluß: -

Veranstaltung

einblenden:

ausblenden:

Titel: 44th Annual Meeting of the Cognitive Science Society (CogSci 2022): Cognitive Diversity

Veranstaltungsort: Toronto, Canada

Start-/Enddatum: 2022-07-27 - 2022-07-30

ausblenden:

Titel: 44th Annual Meeting of the Cognitive Science Society (CogSci 2022): Cognitive Diversity

Genre der Quelle: Konferenzband

Urheber:
Culbertson, J, Herausgeber
Perfors, A, Herausgeber
Rabagliati, H, Herausgeber
Ramenzoni, V, Herausgeber

Affiliations:
-

Ort, Verlag, Ausgabe: -

Seiten: - Band / Heft: - Artikelnummer: - Start- / Endseite: 2940 - 2946 Identifikator: ISSN: 1069-7977

Datensatz

Basisdaten

Dateien

Externe Referenzen

Urheber

Inhalt

Details

Veranstaltung

Entscheidung

Projektinformation

Quelle 1