Deutsch
 
Hilfe Datenschutzhinweis Impressum
  DetailsucheBrowse

Datensatz

 
 
DownloadE-Mail
  Temporal Shingling for Version Identification in Web Archives

Schenkel, R. (2010). Temporal Shingling for Version Identification in Web Archives. In C. Gurrin, Y. He, G. Kazai, U. Kruschwitz, S. Little, T. Roelleke, et al. (Eds.), Advances in Information Retrieval (pp. 508-519). Berlin: Springer. doi:10.1007/978-3-642-12275-0_44.

Item is

Externe Referenzen

einblenden:

Urheber

einblenden:
ausblenden:
 Urheber:
Schenkel, Ralf1, Autor           
Affiliations:
1Databases and Information Systems, MPI for Informatics, Max Planck Society, ou_24018              

Inhalt

einblenden:
ausblenden:
Schlagwörter: -
 Zusammenfassung: Building and preserving archives of the evolving Web has been an important problem in research. Given the huge volume of content that is added or updated daily, identifying the right versions of pages to store in the archive is an important building block of any large-scale archival system. This paper presents temporal shingling, an extension of the well-established shingling technique for measuring how similar two snapshots of a page are. This novel method considers the lifespan of shingles to differentiate between important updates that should be archived and transient changes that may be ignored. Extensive experiments demonstrate the tradeoff between archive size and version coverage, and show that the novel method yields better archive coverage at smaller sizes than existing techniques.

Details

einblenden:
ausblenden:
Sprache(n): eng - English
 Datum: 20102010
 Publikationsstatus: Erschienen
 Seiten: -
 Ort, Verlag, Ausgabe: -
 Inhaltsverzeichnis: -
 Art der Begutachtung: -
 Identifikatoren: eDoc: 536353
DOI: 10.1007/978-3-642-12275-0_44
URI: http://dx.doi.org/10.1007/978-3-642-12275-0_44
Anderer: Local-ID: C1256DBF005F876D-9D56FBDBC4384840C1257678001FDD44-SchenkelECIR2010
 Art des Abschluß: -

Veranstaltung

einblenden:
ausblenden:
Titel: 32nd European Conference on IR Research
Veranstaltungsort: Milton Keynes, UK
Start-/Enddatum: 2010-03-28 - 2010-03-31

Entscheidung

einblenden:

Projektinformation

einblenden:

Quelle 1

einblenden:
ausblenden:
Titel: Advances in Information Retrieval
  Untertitel : 32nd European Conference on IR Research, ECIR 2010
  Kurztitel : ECIR 2010
Genre der Quelle: Konferenzband
 Urheber:
Gurrin, Cathal1, Herausgeber
He, Yulan1, Herausgeber
Kazai, Gabriella1, Herausgeber
Kruschwitz, Udo1, Herausgeber
Little, Suzanne1, Herausgeber
Roelleke, Thomas1, Herausgeber
Rüger, Stefan1, Herausgeber
van Rijsbergen, Keith1, Herausgeber
Affiliations:
1 External Organizations, ou_persistent22            
Ort, Verlag, Ausgabe: Berlin : Springer
Seiten: - Band / Heft: - Artikelnummer: - Start- / Endseite: 508 - 519 Identifikator: ISBN: 978-3-642-12274-3

Quelle 2

einblenden:
ausblenden:
Titel: Lecture Notes in Computer Science
  Kurztitel : LNCS
Genre der Quelle: Reihe
 Urheber:
Affiliations:
Ort, Verlag, Ausgabe: -
Seiten: - Band / Heft: 5993 Artikelnummer: - Start- / Endseite: - Identifikator: -