Semantic sentence similarity: Size does not always matter

Merkx, Danny; Frank, Stefan L.; Ernestus, Mirjam

doi:10.21437/Interspeech.2021-1464

Lokale TagsFreigabegeschichteDetailsÜbersicht

Semantic sentence similarity: Size does not always matter

Merkx, D., Frank, S. L., & Ernestus, M. (2021). Semantic sentence similarity: Size does not always matter. In Proceedings of Interspeech 2021 (pp. 4393-4397). doi:10.21437/Interspeech.2021-1464.

Item is Freigegeben

einblenden: alle ausblenden: alle

Basisdaten

einblenden: ausblenden:

Datensatz-Permalink: https://hdl.handle.net/21.11116/0000-000B-5D7E-1 Versions-Permalink: https://hdl.handle.net/21.11116/0000-000B-5D7F-0

Genre: Konferenzbeitrag

Dateien

einblenden: Dateien

ausblenden: Dateien

:

merkx21_interspeech.pdf (Verlagsversion), 713KB

Öffnen Speichern

Datei-Permalink:
https://hdl.handle.net/21.11116/0000-000B-5D80-C

Name:
merkx21_interspeech.pdf

Beschreibung:
-

OA-Status:
Grün

Sichtbarkeit:
Öffentlich

MIME-Typ / Prüfsumme:
application/pdf / [MD5]

Technische Metadaten:

Öffnen

Copyright Datum:
-

Copyright Info:
-

Lizenz:
-

Externe Referenzen

einblenden:

Urheber

einblenden:

ausblenden:

Urheber:
Merkx, Danny^{1, 2}, Autor
Frank, Stefan L.¹, Autor
Ernestus, Mirjam¹, Autor

Affiliations:
1Center for Language Studies, External Organizations, ou_55238
2International Max Planck Research School for Language Sciences, MPI for Psycholinguistics, Max Planck Society, Nijmegen, NL, ou_1119545

Inhalt

einblenden:

ausblenden:

Schlagwörter: -

Zusammenfassung: This study addresses the question whether visually grounded speech recognition (VGS) models learn to capture sentence semantics without access to any prior linguistic knowledge. We produce synthetic and natural spoken versions of a well known semantic textual similarity database and show that our VGS model produces embeddings that correlate well with human semantic similarity judgements. Our results show that a model trained on a small image-caption database outperforms two models trained on much larger databases, indicating that database size is not all that matters. We also investigate the importance of having multiple captions per image and find that this is indeed helpful even if the total number of images is lower, suggesting that paraphrasing is a valuable learning signal. While the general trend in the field is to create ever larger datasets to train models on, our findings indicate other characteristics of the database can just as important.

Details

einblenden:

ausblenden:

Sprache(n): eng - English

Datum: Online veröffentlicht: 2021

Publikationsstatus: Online veröffentlicht

Seiten: -

Ort, Verlag, Ausgabe: -

Inhaltsverzeichnis: -

Art der Begutachtung: -

Identifikatoren: DOI: 10.21437/Interspeech.2021-1464

Art des Abschluß: -

Veranstaltung

einblenden:

ausblenden:

Titel: Interspeech 2021

Veranstaltungsort: Brno, Chechia

Start-/Enddatum: 2021-08-30 - 2021-09-03

ausblenden:

Titel: Proceedings of Interspeech 2021

Genre der Quelle: Konferenzband

Urheber:

Affiliations:

Ort, Verlag, Ausgabe: -

Seiten: - Band / Heft: - Artikelnummer: - Start- / Endseite: 4393 - 4397 Identifikator: -

Datensatz

Basisdaten

Dateien

Externe Referenzen

Urheber

Inhalt

Details

Veranstaltung

Entscheidung

Projektinformation

Quelle 1