Definieren einer nicht eindeutigen ID

Mit Unique ID Generator kann mithilfe eines der Algorithmen zur Schlüsselgenerierung ein nicht eindeutiger Schlüssel generiert werden. Im nicht eindeutigen Modus können Sie Schlüssel erstellen, die zum Vergleichen verwendet werden sollen. Das kann in einem Data Warehouse nützlich sein, wo Sie bereits Schlüssel zu einer Dimension hinzugefügt haben und einen Schlüssel für neue Datensätze generieren möchten, um festzustellen, ob die neuen Datensätze mit einem vorhandenen Datensatz übereinstimmen.

  1. Klicken Sie im Schritt „Unique ID Generator“ auf der Registerkarte Regeln auf Ändern.
  2. Wählen Sie Aus aus.

    Das deaktiviert den Teil „Eindeutige ID“ der ID-Generierungsregeln. Ist diese Option deaktiviert, wird nur der in den folgenden Schritten gewählte Algorithmus verwendet, um die ID zu erstellen. Das bedeutet, dass alle Datensätze mit denselben Daten in den Feldern, die Sie zum Generieren der ID verwenden, dieselbe ID haben. Sie können dann die ID zum Vergleichen verwenden.

  3. Klicken Sie auf OK.
  4. Klicken Sie bei der Warnungseingabeaufforderung auf Ja.
  5. Klicken Sie im Schritt „Unique ID Generator“ auf Hinzufügen.
  6. Wählen Sie im Feld Algorithmus den Algorithmus aus, den Sie zum Generieren zusätzlicher Informationen in der ID verwenden möchten. Zur Auswahl stehen:
    Consonant
    Gibt die angegebenen Felder mit entfernten Konsonanten zurück.
    Double Metaphone
    Gibt einen auf einer phonetischen Darstellung ihrer Zeichen basierenden Code zurück. „Double Metaphone“ ist eine verbesserte Version des Algorithmus „Metaphone“ und versucht, viele der in unterschiedlichen Sprachen vorkommenden Unregelmäßigkeiten zu berücksichtigen.
    Köln
    Indiziert Namen nach Klang, so wie sie auf Deutsch ausgesprochen werden. Ermöglicht die Codierung von Namen mit derselben Aussprache in derselben Darstellung, sodass sie trotz kleiner Unterschiede bei der Schreibwiese verglichen werden können. Das Ergebnis ist immer eine Folge von Zahlen; Sonderzeichen und Leerzeichen werden ignoriert. Diese Option wurde entwickelt, um auf Einschränkungen von Soundex zu reagieren.
    MD5
    Ein Message Digest-Algorithmus, der einen 128-Bit-Hashwert erzeugt. Dieser Algorithmus wird im Allgemeinen verwendet, um die Datenintegrität zu überprüfen.
    Metaphone
    Gibt einen per Metaphone codierten Schlüssel ausgewählter Felder zurück. Metaphone ist ein Algorithmus, um Wörter anhand ihrer englischen Aussprache zu codieren.
    Metaphone (Spanisch)
    Gibt einen per Metaphone codierten Schlüssel ausgewählter Felder für die spanische Sprache zurück. Dieser Metaphone-Algorithmus codiert Wörter anhand ihrer spanischen Aussprache.
    Metaphone 3
    Übertrifft die Algorithmen „Metaphone“ und „Double Metaphone“ mit genaueren Einstellungen für Konsonanten und inneren Vokalen, was Ihnen ermöglicht, Wörter oder Namen auf phonetischer Basis mehr oder weniger eng mit Suchbegriffen abgeglichen zu erzeugen. Metaphone 3 erhöht die Genauigkeit der phonetischen Codierung auf 98 %. Diese Option wurde entwickelt, um auf Einschränkungen von Soundex zu reagieren.
    NYSIIS
    Phonetischer Codealgorithmus, der eine ungefähr übereinstimmende Aussprache mit der exakten Schreibweise vergleicht und Wörter indiziert, deren Aussprache ähnlich ist. Bestandteil des New York State Identification and Intelligence System. Angenommen, Sie suchen die Daten einer Person in einer Personendatenbank. Sie meinen, dass der Name der Person wie „John Smith“ klingt, er wird aber „Jon Smyth“ geschrieben. Würden Sie eine Suche durchführen, in der nach einer genauen Übereinstimmung mit „John Smith“ gesucht wird, würden keine Ergebnisse zurückgegeben. Wenn Sie jedoch die Datenbank mit dem Algorithmus NYSIIS indizieren und eine erneute Suche mit dem Algorithmus NYSIIS durchführen, wird die richtige Übereinstimmung zurückgegeben, weil vom Algorithmus sowohl „John Smith“ als auch „Jon Smyth“ als „JAN SNATH“ indiziert werden.
    Phonix
    Vorverarbeitet Namenszeichenfolgen, indem mehr als 100 Transformationsregeln auf einzelne Zeichen oder auf Zeichenfolgen angewendet werden. 19 dieser Regeln werden nur angewendet, wenn das bzw. die Zeichen am Anfang der Zeichenfolge stehen, während 12 der Regeln nur angewendet werden, wenn sie in der Mitte der Zeichenfolge stehen. 28 der Regeln werden nur angewendet, wenn sie am Ende der Zeichenfolge stehen. Die transformierte Namenszeichenfolge wird als Code codiert, der aus einem Anfangsbuchstaben gefolgt von drei Stellen besteht (Nullen und doppelt vorhandene Zahlen werden entfernt). Diese Option wurde entwickelt, um auf Einschränkungen von Soundex zu reagieren; sie ist komplexer und deshalb langsamer als Soundex.
    Soundex
    Gibt einen Soundex-Code ausgewählter Felder zurück. Soundex erzeugt einen auf der englischen Aussprache eines Wortes basierenden Code mit fester Länge.
    Teilzeichenfolge
    Gibt einen angegebenen Teil des ausgewählten Feldes zurück.
  7. Wählen Sie im Feld Feldname das Feld, auf das Sie den Algorithmus anwenden möchten. Wenn Sie beispielsweise den Soundex-Algorithmus und ein Feld namens „City“ wählen, wird die ID generiert, indem der Soundex-Algorithmus auf die Daten im Feld „City“ angewendet wird.
  8. Wenn Sie den Algorithmus „SubString“ auswählen, geben Sie den Teil des Feldes an, den Sie in der Teilzeichenfolge verwenden möchten:
    1. Geben Sie im Feld Startposition die Position im Feld an, an der die Teilzeichenfolge beginnen soll.
    2. Wählen Sie im Feld Länge die Anzahl von Zeichen ab der Startposition aus, die Sie in die Teilzeichenfolge einfügen möchten.

      Angenommen, Sie haben die folgenden Daten in einem Feld namens „LastName“:

      Augustine

      Wenn Sie 3 als Startposition und 6 als Endposition angeben, ergibt die Teilzeichenfolge:

      gustin

  9. Aktivieren Sie das Kästchen Sonderzeichen entfernen, um vor der Anwendung des Algorithmus alle nicht numerischen und nicht alphabetischen Zeichen wie Bindestriche, Leerzeichen und sonstige Sonderzeichen aus dem Feld zu entfernen.
  10. Für die Algorithmen „Consonant“ und „SubString“ können Sie die Daten im Feld vor der Anwendung des Algorithmus sortieren. Aktivieren Sie dazu das Kästchen Eingabe sortieren. Sie können dann wählen, ob entweder die Zeichen im Feld oder Begriffe im Feld in alphabetischer Reihenfolge sortiert werden sollen.
  11. Klicken Sie auf OK, um Ihre Einstellungen zu speichern.
  12. Wiederholen Sie diese Schritte nach Bedarf, wenn Sie zusätzliche Algorithmen hinzufügen möchten, um eine komplexere ID zu erzeugen.
    Anmerkung: Die eindeutige Schlüsseldefinition wird immer in einer anderen Farbe angezeigt und kann nicht gelöscht werden.