Sie befinden Sich nicht im Netzwerk der Universität Paderborn. Der Zugriff auf elektronische Ressourcen ist gegebenenfalls nur via VPN oder Shibboleth (DFN-AAI) möglich. mehr Informationen...
Ergebnis 25 von 29
Engineering, technology & applied science research, 2019-10, Vol.9 (5), p.4755-4758
2019
Volltextzugriff (PDF)

Details

Autor(en) / Beteiligte
Titel
Performance Analysis of Duplicate Record Detection Techniques
Ist Teil von
  • Engineering, technology & applied science research, 2019-10, Vol.9 (5), p.4755-4758
Ort / Verlag
D. G. Pylarinos
Erscheinungsjahr
2019
Quelle
Free E-Journal (出版社公開部分のみ)
Beschreibungen/Notizen
  • In this paper, a comprehensive performance analysis of duplicate data detection techniques for relational databases has been performed. The research focuses on traditional SQL based and modern bloom filter techniques to find and eliminate records which already exist in the database while performing bulk insertion operation (i.e. bulk insertion involved in the loading phase of the Extract, Transform, and Load (ETL) process and data synchronization in multisite database synchronization). The comprehensive performance analysis was performed on several data sizes using SQL, bloom filter, and parallel bloom filter. The results show that the parallel bloom filter is highly suitable for duplicate detection in the database.
Sprache
Englisch
Identifikatoren
ISSN: 2241-4487
eISSN: 1792-8036
DOI: 10.48084/etasr.3036
Titel-ID: cdi_doaj_primary_oai_doaj_org_article_51961a791c584af3b2c78468193e5af3
Format
Schlagworte
bloom filter, duplicate detection, SQL

Weiterführende Literatur

Empfehlungen zum selben Thema automatisch vorgeschlagen von bX