Hinzufügen eines Zeitstempels zu Datensätzen in einem Data Warehouse

Eine bequeme Möglichkeit zur Sicherstellung der Datenqualität besteht darin, Datensätze im Data Warehouse mit dem Datum zu kennzeichnen, an dem sie geladen wurden. Wenn der Ladeprozess nicht abgeschlossen wird oder Sie Probleme bemerken, nachdem die Daten bereits geladen wurden, hilft eine Zeitstempelspalte, die betroffenen Datensätze zu identifizieren. Sie können dann alle Datensätze löschen, die während eines bestimmten Schrittes verarbeitet wurden, zum Status vor dem Ladevorgang zurückkehren und alle Probleme beheben, bevor Sie erneut versuchen, die Daten zu laden. Sie können den Ladevorgang mit einem Zeitstempel versehen, indem Sie Ihrer Faktentabelle über den „SQL Command“-Schritt eine zusätzliche Spalte wie „Ladestatus“ hinzufügen.

So lassen Sie den Datenfluss beim Füllen oder Aktualisieren eines Data Warehouse einen Zeitstempel hinzufügen:

  1. Öffnen Sie im Enterprise Designer den Datenfluss, der das Data Warehouse füllt oder aktualisiert:
  2. Ziehen Sie einen Transformer-Schritt auf die Arbeitsfläche und verbinden Sie ihn kurz vor dem „Write to DB“-Schritt mit dem Datenfluss.

    Beispiel:



  3. Doppelklicken Sie auf den „Transformer“-Schritt.
  4. Klicken Sie auf Add (Hinzufügen).
  5. Wählen Sie unter Allgemein Benutzerdefiniert aus.
  6. Geben Sie in das Feld Name der benutzerdefinierten Transformation einen Namen für diese Transformation ein. Sie können einen beliebigen Namen auswählen, beispielsweise „Zeitstempel hinzufügen“.
  7. Geben Sie im Feld Benutzerdefiniertes Skript Folgendes ein:
    data['<timestamp field>']=currentDateTime()

    Dabei ist <timestamp field> der Name des Datenflussfeldes, das den Zeitstempel enthalten soll.

    Wenn Sie beispielsweise den Zeitstempel in einem Datenflussfeld namens Timestamp speichern möchten, sieht Ihr benutzerdefiniertes Skript folgendermaßen aus:

    data['Timestamp']=currentDateTime()
  8. Klicken Sie unten im Fenster auf die Schaltfläche Hinzufügen.
  9. Klicken Sie auf Schließen.
  10. Klicken sie auf OK, um das Fenster Transformer-Optionen zu schließen.

Der Datenfluss fügt nun zu jedem Datensatz die aktuelle Zeit in einem Feld hinzu und erweitert das Data Warehouse damit um einen Zeitstempel, der anzeigt, wann ein Datensatz geladen wurde.