NEU: Das eBook.de Hörbuch Abo - jederzeit, überall, für nur 7,95 € monatlich!
Jetzt entdecken
mehr erfahren
Produktbild: Partitionierung zur effizienten Duplikaterkennung in relationalen Daten | Uwe Draisbach
Produktbild: Partitionierung zur effizienten Duplikaterkennung in relationalen Daten | Uwe Draisbach

Partitionierung zur effizienten Duplikaterkennung in relationalen Daten

(0 Bewertungen)15
eBook pdf
eBook pdf
47,49 €inkl. Mwst.
Sofort lieferbar (Download)
Empfehlen

Duplikate bzw. Dubletten sind mehrere Datensätze, die das gleiche Realweltobjekt beschreiben, etwa mehrfach erfasste Kunden in einem CRM-System oder unterschiedliche Repräsentationen eines Produkts. Das Auffinden dieser Duplikate ist auch für moderne Computer eine komplexe und zeitintensive Aufgabe. Uwe Draisbach vergleicht zwei der einschlägigen Partitionierungsstrategien, die eine intelligente Auswahl von zu vergleichenden Datensatzpaaren treffen. Daraus entwickelt er ein verallgemeinertes Verfahren und zeigt, dass eine intelligente Auswahl der Datensatzpaare den Aufwand signifikant reduzieren kann, ohne die Qualität der Duplikaterkennung wesentlich zu verringern.

Die Arbeit wurde mit dem "Information Quality Best Master Degree Award" der Deutschen Gesellschaft für Informations- und Datenqualität ausgezeichnet.

Inhaltsverzeichnis


Duplikaterkennung.- Blocking-Verfahren.- Windowing-Verfahren.- Vergleich Blocking- und Sorted-Neighborhood-Methode.- Verallgemeinertes Verfahren


Produktdetails

Erscheinungsdatum
09. März 2012
Sprache
deutsch
Auflage
2012
Seitenanzahl
91
Dateigröße
0,96 MB
Reihe
Ausgezeichnete Arbeiten zur Informationsqualität
Autor/Autorin
Uwe Draisbach
Verlag/Hersteller
Originalsprache
deutsch
Kopierschutz
mit Wasserzeichen versehen
Produktart
EBOOK
Dateiformat
PDF
ISBN
9783834882899

Portrait

Uwe Draisbach

Uwe Draisbach studierte Informatik an der FernUniversität Hagen und ist wissenschaftlicher Mitarbeiter am Hasso-Plattner-Institut in Potsdam.


Bewertungen

0 Bewertungen

Es wurden noch keine Bewertungen abgegeben. Schreiben Sie die erste Bewertung zu "Partitionierung zur effizienten Duplikaterkennung in relationalen Daten" und helfen Sie damit anderen bei der Kaufentscheidung.