Flusstypen

Ein Datenfluss ist eine Reihe von Operationen, die Daten aus einer beliebigen Quelle abrufen, diese Daten verarbeiten und dann die Ausgabe in ein beliebiges Ziel schreiben. Bei der Verarbeitung der Daten kann es um einfaches Sortieren bis hin zu komplexeren Aktionen für Datenqualität und -ergänzung gehen. Das Konzept eines Datenflusses ist einfach, Sie können aber äußerst komplexe Datenflüsse mit Verzweigungspfaden, mehreren Eingabequellen und mehreren Ausgabezielen entwerfen.

Es gibt vier Typen von Datenflüssen: Aufträge, Dienste, Unterflüsse und Prozessflüsse.

Auftrag

Ein Auftrag ist ein Datenfluss, der eine Batch-Verarbeitung ausführt. Ein Auftrag liest Daten aus einer oder mehr Dateien oder Datenbanken, verarbeitet diese Daten und schreibt die Ausgabe in eine oder mehr Dateien oder Datenbanken. Aufträge können manuell im Enterprise Designer oder in einer Befehlszeile mit Job Executor ausgeführt werden.

Der folgende Datenfluss ist ein Auftrag. Beachten Sie, dass er den „Read from File“-Schritt für die Eingabe und zwei „Write to File“-Schritte als Ausgabe nutzt.



Dienst

Ein Dienst ist ein Datenfluss, auf den Sie in Form von Webservices oder über die Spectrum™ Technology Platform-API zugreifen können. Sie übergeben dem Dienst einen Datensatz und geben optional die bei der Verarbeitung des Datensatzes zu verwendenden Optionen an. Der Dienst verarbeitet die Daten und gibt die Daten zurück.

Manche Dienste werden verfügbar, wenn Sie ein Modul installieren. Wenn Sie z. B. das Universal Addressing-Modul installieren, wird der Dienst „ValidateAddress“ auf Ihrem System verfügbar. In anderen Fällen müssen Sie einen Dienst im Enterprise Designer erstellen und diesen dann auf Ihrem System als benutzerdefinierten Dienst verfügbar machen. Zum Beispiel sind die Schritte des Location Intelligence-Moduls nicht als Dienste verfügbar, sofern Sie nicht zuerst einen Dienst erstellen, der die Schritte des Moduls nutzt.

Sie können auch eigene benutzerdefinierte Dienste im Enterprise Designer entwerfen. Zum Beispiel ermittelt der folgende Datenfluss, ob für eine Adresse ein Flooding-Risiko besteht:



Anmerkung: Da der Dienstname, Optionsname und Feldname letztendlich zu XML-Elementen werden, dürfen sie keine Zeichen enthalten, die in XML-Elementnamen ungültig sind (zum Beispiel sind Leerzeichen nicht erlaubt). Dienste, die dieser Anforderung nicht entsprechen, funktionieren weiterhin, werden aber nicht als Webservices verfügbar gemacht.

Unterfluss

Ein Unterfluss ist ein Datenfluss, der innerhalb anderer Datenflüsse wiederverwendet werden kann. Unterflüsse sind nützlich, wenn Sie einen wiederverwendbaren Prozess erstellen möchten, der ohne großen Aufwand in Datenflüsse eingebunden werden kann. Sie könnten beispielsweise einen Unterfluss erstellen, der eine Deduplizierung ausführt und in jedem Schritt bestimmte Einstellungen nutzt, sodass Sie denselben Deduplizierungsprozess in mehreren Datenflüssen verwenden können. Zu diesem Zweck könnten Sie einen Unterfluss wie diesen erstellen:

Danach könnten Sie diesen Unterfluss in einem Datenfluss verwenden. Sie könnten beispielsweise den Deduplizierungsunterfluss innerhalb eines Datenflusses verwenden, der Geocoding ausführt, sodass die Daten vor der Geocoding-Operation dedupliziert werden:

In diesem Beispiel würden Daten aus einer Datenbank eingelesen und dann dem Deduplizierungsunterfluss übergeben, wo sie durch Match Key Generator, dann Intraflow Match, dann Best of Breed verarbeitet und schließlich aus dem Unterfluss heraus in den nächsten Schritt im übergeordneten Datenfluss, in diesem Fall „Geocode US Address“, gesendet würden. Unterflüsse werden durch ein Puzzleteil-Symbol im Datenfluss dargestellt (siehe oben).

Unterflüsse, die gespeichert und verfügbar gemacht werden, werden im Ordner Benutzerdefinierte Schritte im Enterprise Designer angezeigt.

Prozessfluss

In einem Prozessfluss werden eine Reihe von Aktivitäten ausgeführt, wie z. B. Aufträge und externe Anwendungen. Jede Aktivität im Prozessfluss wird nach Beendigung der vorherigen Aktivität ausgeführt. Prozessflüsse sind nützlich, wenn Sie mehrere Datenflüsse nacheinander ausführen möchten oder wenn Sie ein externes Programm ausführen möchten. In einem Prozessfluss könnte beispielsweise ein Auftrag zum Standardisieren von Namen und Überprüfen von Adressen ausgeführt werden und anschließend eine externe Anwendung aufgerufen werden, um die Datensätze in die richtige Reihenfolge zu bringen, damit Portoermäßigungen geltend gemacht werden können. Ein solcher Prozessfluss würde wie folgt aussehen:

In diesem Beispiel wurden die Aufträge „Namen standardisieren“ und „Adressen überprüfen“ auf dem Spectrum™ Technology Platform-Server verfügbar gemacht. Über die Aktivität „Programm ausführen“ wird eine externe Anwendung aufgerufen und die Aktivität „Erfolg“ gibt das Ende des Prozessflusses an.