Ausfüllen von Dimensionstabellen

Dimensionstabellen sind Teil eines „Star Schema“ und enthalten detaillierte Informationen über die Spalten in der Faktentabelle. Dimensionstabellen verfügen über Attribute und einen einteiligen Primärschlüssel, über den eine Dimensionstabelle mit der Faktentabelle verbunden ist. Über den einteiligen Primärschlüssel können Sie eine einzelne Dimensionstabelle schnell durchsuchen. Das Durchsuchen einer Dimensionstabelle kann Ihnen helfen, die beste Möglichkeit zur Abfrage der Faktentabelle zu finden.

Die folgenden Schritte beschreiben, wie Sie Spectrum™ Technology Platform verwenden, um die Dimensionstabelle in Ihrem Data Warehouse erstmals zu füllen.

Anmerkung: Wenn Sie als Datenquelle eine Datenbank, einen Dateiserver oder einen Webservice verwenden, müssen Sie vor Beginn die Verbindungen zu externen Ressourcen definieren, die Sie als Quelle für die Dimensionstabelle verwenden möchten. Sie müssen außerdem eine Verbindung zu dem Data Warehouse definieren, in dem Sie eine Dimensionstabelle erstellen möchten. Wenn Sie die erforderlichen Verbindungen nicht definiert haben, lesen Sie weiter unter Datenquellenverbindungen.
  1. Erstellen Sie in Ihrem Data Warehouse die Tabelle, die Sie als Dimensionstabelle verwenden möchten.
  2. Erstellen Sie in der Management Console Verbindungen zu Ihrer Datenquelle und zum Data Warehouse.
  3. Klicken Sie im Enterprise Designer auf Datei > Neu > Datenfluss > Auftrag.
  4. Ziehen Sie den Quellschritt auf die Arbeitsfläche.
    • Um Daten aus einer Datenbank zum Füllen der Tabelle zu verwenden, ziehen Sie den Read from DB-Schritt auf die Arbeitsfläche.
    • Um Daten aus einem Flatfile zum Füllen der Tabelle zu verwenden, ziehen Sie den Read from File-Schritt auf die Arbeitsfläche.
    • Um Daten aus einer Datei mit variablem Format zum Füllen der Tabelle zu verwenden, ziehen Sie den Read from Variable Format File-Schritt auf die Arbeitsfläche.
    • Um Daten aus einer XML-Datei zum Füllen der Tabelle zu verwenden, ziehen Sie den Read from XML-Schritt auf die Arbeitsfläche.
  5. Doppelklicken Sie auf den Quellschritt, den Sie gerade auf der Arbeitsfläche platziert haben, und konfigurieren Sie ihn, auf die Quelle der Daten zu verweisen, mit denen Sie die Dimensionstabelle füllen möchten.
  6. Ziehen Sie einen „Unique ID Generator“-Schritt auf die Arbeitsfläche und verbinden Sie ihn mit dem Quellschritt. Wenn Sie beispielsweise „Read from DB“ als Quellschritt verwenden, müssten Sie den „Read from DB“-Schritt mit dem „Unique ID Generator“-Schritt verbinden.
  7. Doppelklicken Sie auf den „Unique ID Generator“-Schritt auf der Arbeitsfläche und konfigurieren Sie ihn, einen Surrogatschlüssel zu erstellen.
    Anmerkung: Normalerweise wird der Schlüssel des Betriebssystems nicht als Primärschlüssel einer Dimension im Warehouse verwendet. So kann die historische Konsistenz besser erhalten werden, da ein Schlüsselwert sich im Betriebssystem möglicherweise ändern kann.
  8. Ziehen Sie einen „Write to DB“-Schritt auf die Arbeitsfläche und verbinden Sie ihn mit dem „Unique ID Generator“-Schritt.
  9. Doppelklicken Sie auf den „Write to DB“-Schritt auf der Arbeitsfläche und konfigurieren Sie ihn, auf die Datenbank und die Dimensionstabelle zu verweisen, die Sie füllen möchten. Weitere Informationen zum Konfigurieren des „Write to DB“-Schrittes finden Sie unter Write to DB.
  10. Wählen Sie Datei > Speichern aus, und speichern Sie den Datenfluss.
  11. Um den Datenfluss jetzt auszuführen und die Dimensionstabelle zu füllen, wählen Sie Ausführen > Aktuellen Fluss ausführen aus.