Sie befinden Sich nicht im Netzwerk der Universität Paderborn. Der Zugriff auf elektronische Ressourcen ist gegebenenfalls nur via VPN oder Shibboleth (DFN-AAI) möglich. mehr Informationen...

Technische Störung

Das Bibliothekssystem ALMA ist derzeit von einer weltweiten Störung von IT-Diensten betroffen. Aktuell besteht kein Zugriff auf die Bibliothekskonten der Nutzer*innen. Somit sind z.B. keine Vormerkungen, Fristverlängerungen und Bestellungen von Medien aus dem Magazin möglich.

Wir bitten um Ihr Verständnis.

Ergebnis 10 von 82
Proceedings of the VLDB Endowment, 2015-07, Vol.8 (11), p.1130-1141
2015

Details

Autor(en) / Beteiligte
Titel
Scaling similarity joins over tree-structured data
Ist Teil von
  • Proceedings of the VLDB Endowment, 2015-07, Vol.8 (11), p.1130-1141
Erscheinungsjahr
2015
Link zum Volltext
Quelle
ACM Digital Library
Beschreibungen/Notizen
  • Given a large collection of tree-structured objects (e.g., XML documents), the similarity join finds the pairs of objects that are similar to each other, based on a similarity threshold and a tree edit distance measure. The state-of-the-art similarity join methods compare simpler approximations of the objects (e.g., strings), in order to prune pairs that cannot be part of the similarity join result based on distance bounds derived by the approximations. In this paper, we propose a novel similarity join approach, which is based on the dynamic decomposition of the tree objects into subgraphs, according to the similarity threshold. Our technique avoids computing the exact distance between two tree objects, if the objects do not share at least one common subgraph. In order to scale up the join, the computed subgraphs are managed in a two-layer index. Our experimental results on real and synthetic data collections show that our approach outperforms the state-of-the-art methods by up to an order of magnitude.
Sprache
Englisch
Identifikatoren
ISSN: 2150-8097
eISSN: 2150-8097
DOI: 10.14778/2809974.2809976
Titel-ID: cdi_crossref_primary_10_14778_2809974_2809976
Format

Weiterführende Literatur

Empfehlungen zum selben Thema automatisch vorgeschlagen von bX