Deutsch
 
Hilfe Datenschutzhinweis Impressum
  DetailsucheBrowse

Datensatz

DATENSATZ AKTIONENEXPORT
  Building and curating conversational corpora for diversity-aware language science and technology

Liesenfeld, A., & Dingemanse, M. (2022). Building and curating conversational corpora for diversity-aware language science and technology. In F. Béchet, P. Blache, K. Choukri, C. Cieri, T. DeClerck, S. Goggi, et al. (Eds.), Proceedings of the 13th Language Resources and Evaluation Conference (LREC 2022) (pp. 1178-1192). Marseille, France: European Language Resources Association.

Item is

Basisdaten

einblenden: ausblenden:
Genre: Konferenzbeitrag

Dateien

einblenden: Dateien
ausblenden: Dateien
:
Liesenfeld_Dingemanse_2022_Building and curating conversational corpora for diversity-aware language.pdf (Verlagsversion), 2MB
Name:
Liesenfeld_Dingemanse_2022_Building and curating conversational corpora for diversity-aware language.pdf
Beschreibung:
-
OA-Status:
Grün
Sichtbarkeit:
Öffentlich
MIME-Typ / Prüfsumme:
application/pdf / [MD5]
Technische Metadaten:
Copyright Datum:
2022
Copyright Info:
-
Lizenz:
-

Externe Referenzen

einblenden:

Urheber

einblenden:
ausblenden:
 Urheber:
Liesenfeld, Andreas1, Autor
Dingemanse, Mark1, Autor           
Affiliations:
1Center for Language Studies, External Organizations, ou_55238              

Inhalt

einblenden:
ausblenden:
Schlagwörter: -
 Zusammenfassung: We present an analysis pipeline and best practice guidelines for building and curating corpora of everyday conversation in diverse languages. Surveying language documentation corpora and other resources that cover 67 languages and varieties from 28 phyla, we describe the compilation and curation process, specify minimal properties of a unified format for interactional data, and develop methods for quality control that take into account turn-taking and timing. Two case studies show the broad utility of conversational data for (i) charting human interactional infrastructure and (ii) tracing challenges and opportunities for current ASR solutions. Linguistically diverse conversational corpora can provide new insights for the language sciences and stronger empirical foundations for language technology.

Details

einblenden:
ausblenden:
Sprache(n):
 Datum: 2022
 Publikationsstatus: Erschienen
 Seiten: -
 Ort, Verlag, Ausgabe: -
 Inhaltsverzeichnis: -
 Art der Begutachtung: Expertenbegutachtung
 Art des Abschluß: -

Veranstaltung

einblenden:
ausblenden:
Titel: the 13th Language Resources and Evaluation Conference (LREC 2022)
Veranstaltungsort: Marseille, France
Start-/Enddatum: 2022-06-20 - 2022-06-25

Entscheidung

einblenden:

Projektinformation

einblenden:

Quelle 1

einblenden:
ausblenden:
Titel: Proceedings of the 13th Language Resources and Evaluation Conference (LREC 2022)
Genre der Quelle: Konferenzband
 Urheber:
Béchet, F., Herausgeber
Blache, P., Herausgeber
Choukri, K., Herausgeber
Cieri, C., Herausgeber
DeClerck, T., Herausgeber
Goggi, S., Herausgeber
Isahara, H., Herausgeber
Maegaard, B., Herausgeber
Mariani, J., Herausgeber
Mazo, H., Herausgeber
Odijk, J., Herausgeber
Piperidis , S., Autor
Affiliations:
-
Ort, Verlag, Ausgabe: Marseille, France : European Language Resources Association
Seiten: - Band / Heft: - Artikelnummer: - Start- / Endseite: 1178 - 1192 Identifikator: -