Deutsch
 
Hilfe Datenschutzhinweis Impressum
  DetailsucheBrowse

Datensatz

DATENSATZ AKTIONENEXPORT
  Less is Better: A cognitively inspired unsupervised model for language segmentation

Yang, J., Van den Bosch, A., & Frank, S. L. (2020). Less is Better: A cognitively inspired unsupervised model for language segmentation. In M. Zock, E. Chersoni, A. Lenci, & E. Santus (Eds.), Proceedings of the Workshop on the Cognitive Aspects of the Lexicon ( 28th International Conference on Computational Linguistics) (pp. 33-45). Stroudsburg: Association for Computational Linguistics.

Item is

Basisdaten

einblenden: ausblenden:
Genre: Konferenzbeitrag

Dateien

einblenden: Dateien
ausblenden: Dateien
:
2020.cogalex-1.4.pdf (Verlagsversion), 554KB
Name:
2020.cogalex-1.4.pdf
Beschreibung:
-
OA-Status:
Keine Angabe
Sichtbarkeit:
Öffentlich
MIME-Typ / Prüfsumme:
application/pdf / [MD5]
Technische Metadaten:
Copyright Datum:
2020
Copyright Info:
-

Externe Referenzen

einblenden:
ausblenden:
externe Referenz:
full text via ACL website (Ergänzendes Material)
Beschreibung:
-
OA-Status:
Keine Angabe

Urheber

einblenden:
ausblenden:
 Urheber:
Yang, Jinbiao1, 2, 3, Autor           
Van den Bosch, Antal 4, Autor
Frank, Stefan L. 3, Autor
Affiliations:
1Other Research, MPI for Psycholinguistics, Max Planck Society, ou_55217              
2International Max Planck Research School for Language Sciences, MPI for Psycholinguistics, Max Planck Society, Nijmegen, NL, ou_1119545              
3Center for Language Studies, External Organizations, ou_55238              
4KNAW Meertens Institute, ou_persistent22              

Inhalt

einblenden:
ausblenden:
Schlagwörter: -
 Zusammenfassung: Language users process utterances by segmenting them into many cognitive units, which vary in their sizes and linguistic levels. Although we can do such unitization/segmentation easily, its cognitive mechanism is still not clear. This paper proposes an unsupervised model, Less-is-Better (LiB), to simulate the human cognitive process with respect to language unitization/segmentation. LiB follows the principle of least effort and aims to build a lexicon which minimizes the number of unit tokens (alleviating the effort of analysis) and number of unit types (alleviating the effort of storage) at the same time on any given corpus. LiB’s workflow is inspired by empirical cognitive phenomena. The design makes the mechanism of LiB cognitively plausible and the computational requirement light-weight. The lexicon generated by LiB performs the best among different types of lexicons (e.g. ground-truth words) both from an information-theoretical view and a cognitive view, which suggests that the LiB lexicon may be a plausible proxy of the mental lexicon.

Details

einblenden:
ausblenden:
Sprache(n): eng - English
 Datum: 2020-12
 Publikationsstatus: Online veröffentlicht
 Seiten: -
 Ort, Verlag, Ausgabe: -
 Inhaltsverzeichnis: -
 Art der Begutachtung: -
 Identifikatoren: -
 Art des Abschluß: -

Veranstaltung

einblenden:
ausblenden:
Titel: The 28th International Conference on Computational Linguistics (COLING 2020)
Veranstaltungsort: -
Start-/Enddatum: 2020-12-08 - 2020-12-13

Entscheidung

einblenden:

Projektinformation

einblenden: ausblenden:
Projektname : -
Grant ID : -
Förderprogramm : -
Förderorganisation : Max Planck Institute for Psycholinguistics

Quelle 1

einblenden:
ausblenden:
Titel: Proceedings of the Workshop on the Cognitive Aspects of the Lexicon ( 28th International Conference on Computational Linguistics)
Genre der Quelle: Konferenzband
 Urheber:
Zock, M., Herausgeber
Chersoni, E., Herausgeber
Lenci, A., Herausgeber
Santus, E., Herausgeber
Affiliations:
-
Ort, Verlag, Ausgabe: Stroudsburg : Association for Computational Linguistics
Seiten: - Band / Heft: - Artikelnummer: - Start- / Endseite: 33 - 45 Identifikator: -