
Zwei identische Zeichenketten kann jeder Rechner zuordnen. Doch Ähnlichkeiten wie Meier zu Mayer versteht nicht jeder PC. Doch genau solche Ähnlichkeiten sind z.B. bei einer Dublettenprüfung entscheidend. Besser geht es mit dem fehlertoleranten Vergleichs-Algorithmus FACT, der Tippfehler, Wortumstellungen und andere Abweichungen treffsicher zuordnet.
| Vergleich 1 | Vergleich 2 | Ähnlichkeit |
|---|---|---|
| Mueller Moebel GmbH | Möbelmüller GmbH | 94 % |
| Sponheimstraße 12 | Sponheimerstraße 12 | 97 % |
| Sponheimstraße 12 | Sponheimerstraße 21 | 91 % |
| Bauamt Wuntorf (Bauveralt.) | Bauverwaltung Bauamt Wundorf | 86 % |
Hauptaufgabe vieler Datenqualitäts-Operationen sind Ähnlichkeits-Vergleiche. Bei der Dublettenprüfung sollen beispielsweise doppelte Adresseinträge gefunden werden – und zwar auch dann, wenn Tippfehler oder Wortumstellungen den Vergleich erschweren. Und bei einer postalischen Korrektur müssen auch abgekürzte Straßen für eine Korrektur erkannt und zugeordnet werden.
Der von Omikron entwickelte Algorithmus ermöglicht solche Ähnlichkeits-Vergleiche. Die Technologie kommt unter anderem in folgenden Omikron-Produkten zum Einsatz:
Fordern Sie gleich weitere Infos zu unseren Ähnlichkeits-Verfahren und Data-Quality-Lösungen an: 07231/12597-0 oder über das Kontaktformular