Tabellen- und Spaltendetails in den Ergebnissen der Profilerstellung

Die Seite Ergebnisse der Datenprofilerstellung kann in drei Teile unterteilt werden:
  • Ein Header, der die Profildetails enthält
  • Der linke Bereich, der den Profilnamen und alle enthaltenen Tabellen und Spalten anzeigt
  • Der Berichtsbereich, der eine illustrierte Ansicht der analysierten Daten zeigt

Der rechts angezeigte Bericht basiert auf Ihrer Auswahl im linken Bereich (Profil, Tabelle oder Spalte). Details wie die Standardabweichung (Stdev) sowie Maximal- (Max), Mindest- (Min) und Mittelwerte werden auf Spaltenebene für numerische Daten angezeigt, während die Längenhäufigkeit und Textmusterhäufigkeit für Zeichenfolgenspalten angezeigt werden. Darüber hinaus werden basierend auf den für die Profilerstellung ausgewählten Regeln weitere Registerkarten im Bericht angezeigt, z. B. Semantiktyp für Spalten mit Semantiktypwerten, wenn die Regel Semantikanalyse ausgewählt ist. Weitere Informationen finden Sie unter Profilerstellungsregeln.

Darüber hinaus können Sie an Ihren Profilergebnissen mithilfe der Kommentarfunktion, die auf Modell-, Tabellen- und Spaltenebene verfügbar ist, zusammenarbeiten. Details finden Sie unter Zusammenarbeiten mit Data Profiling-Ergebnissen.

Profildetail

Der Header des Berichts enthält die folgenden Details des analysierten Profils.

  • Profilname: Name des Profils
  • Beschreibung: Eine kurze Beschreibung des Profils
  • Gestartet: Das Datum (jjjj/mm/tt), die Uhrzeit (hh:mm:ss) und der Zeitraum (AM oder PM), in dem die Analyse gestartet wurde.
  • Datenquelle: Die Quelle der zu analysierenden Daten im Profil. Dies kann ein physisches oder logisches Modell oder eine direkte Datenquellenverbindung sein.
  • Benutzer: Der Benutzer, der das Profil erstellt hat
  • Tabellen: Die Anzahl der Tabellen im ausgewähltem Modell
  • Datenquellentyp: Gibt an, ob die Datenquelle für das Profil ein Modell oder eine Datenbank ist.
  • Datensätze: Die Gesamtzahl der analysierten Datensätze

Modell- und Tabellendetails

Der linke Navigationsbereich der Seite Ergebnisse der Datenprofilerstellung zeigt das analysierte Profil und die darin enthaltenen Tabellen und Spalten an. Der illustrierte Bericht, der rechts angezeigt wird, entspricht der im linken Bereich erfolgten Auswahl. Wenn Sie beispielsweise auf den Profilnamen klicken, zeigt der Bericht Folgendes an:
  • Zusammenfassung des Profils, in der der Prozentsatz vollständiger und unvollständiger Zeilen in den Profildaten angezeigt wird.
  • Einen Überblick der Tabellen in den Profildaten auf der Registerkarte Tabellenzusammenfassung.
Sie können das Textfeld Suchen im linken Navigationsbereich nutzen, um die relevante Tabelle oder Spalte zu finden.
Anmerkung: Für den Datentyp date zeigen die Ergebnisse die Zeitzone des Clientcomputers an.

Die Ergebnisse der Datenprofilerstellung

Basierend auf Ihrer Auswahl im linken Bereich dieser Seite werden die Berichte im rechten Bereich angezeigt.
  • Profilanalysebericht: Klicken Sie im linken Bereich auf den Datenquellennamen, um die folgenden Details anzuzeigen:
    • Vollständigkeit: Die Vollständigkeit der Zeilen in den Profildaten als Prozentsatz
    • Tabellenübersicht: Zeigt diese Details für jede Tabelle im Profil an
      • Tabellenname: Die Namen aller Tabellen im Profil
      • Anzahl der Spalten: Die Anzahl der Spalten in der Tabelle
      • Anzahl der Datensätze: Die Anzahl der Datensätze in der Tabelle
      • Vollständigkeit (%): Die Vollständigkeit der Datensätze in der Tabelle
  • Tabellenbericht: Klicken Sie im linken Bereich auf einen beliebigen Tabellennamen, um die folgenden Details anzuzeigen:
    Anmerkung: Unter FlatfileProfilerstellung können Sie fehlerhafte Datensätze in Ihrer Tabelle anzeigen, indem Sie auf die Registerkarte Falsch formatierte Datensätze klicken. Diese Registerkarte zeigt die Kategorie und Anzahl der falsch formatierten Datensätze an. Ein Datensatz wird für die folgenden Kategorien als falsch formatiert behandelt:
    • Zeilen mit einer geringeren Anzahl von Feldern als die Anzahl der definierten Spalten
    • Zeilen mit einer größeren Anzahl von Feldern als die Anzahl der definierten Spalten

      Sie können auch eine Vorschau der falsch formatierten Datensätze anzeigen, indem Sie auf die Kategorie klicken. In der Vorschau werden die Datensatznummer, der Datensatz und der Grund für die Kategorisierung eines Datensatzes als falsch formatiert angezeigt.

    • Vollständigkeit: Die Vollständigkeit der Zeilen in der Tabelle als Prozentsatz
    • Spaltenübersicht: Zeigt diese Details für jede Spalte in der Tabelle an
      • Spaltenname: Die Namen aller Spalten in der Tabelle
      • Spaltentyp: Der Datentyp in der Spalte
      • Vollständigkeit (%): Die Vollständigkeit der Datensätze in der Spalte
      • Eindeutigkeit (%): Die Eindeutigkeit der in der Spalte enthaltenen Daten
      • Erkannter Typ: Zeigt Semantiktypen wie E-Mail, Telefon, Ort, Vorname und Nachname an, die in der Zeichenfolge in dieser Spalte ermittelt wurden
    • Häufigkeit NULL-Anzahl: Zeigt die Anzahl der Nullwerte in jeder Tabellenzeile an
    Anmerkung: Sie können eine Zusammenfassung der gefundenen Ausreißer für jede Spalte in Ihrer Tabelle anzeigen, indem Sie auf die Registerkarte Ausreißeranalyse klicken. Auf dieser Registerkarte werden Vorkommnisse nach Kategorie von Mustern, Werten, Längen oder Häufigkeiten für eine Spalte angezeigt, die nicht in den Bereich anderer Beobachtungen fallen. Die unterstützten Kategorien sind Längenausreißer, Häufigkeitsausreißer, Musterausreißer, Numerische Ausreißer, Semantikausreißer und Datentypausreißer.
  • Spaltenbericht: Klicken Sie im linken Bereich auf eine beliebige Spalte, um die folgenden Details anzuzeigen:
    Anmerkung: Sie können die in einer Spalte erkannten Ausreißer anzeigen, indem Sie auf die Registerkarte Ausreißer klicken. Diese Registerkarte zeigt eine tabellarische Struktur der nach Kategorie erkannten Ausreißer in Ihrer Spalte an. Details wie Muster, Länge, Wert oder Häufigkeit, Berechneter Bereich und Vorkommnis werden ebenfalls angezeigt.
    • Vollständigkeit: Die Vollständigkeit der Daten in der Spalte als Prozentsatz
    • Eindeutigkeit: Die Eindeutigkeit der Daten in der Spalte (%)
    • Min. Länge und Max. Länge der Zeichen, falls die Spaltendaten eine Zeichenfolge sind
    • Die Werte für Standardabweichung (Stdev), Maximum (Max), Minimum (Min) und Durchschnitt, falls die Spalte numerische Daten enthält
    • Häufigkeit: Die Häufigkeit der Daten in der Spalte
    • Längenhäufigkeit: Für den Fall, dass der Datentyp der Spalte eine Zeichenfolge ist
    • Häufigkeit des Textmusters: Für den Fall, dass der Datentyp der Spalte eine Zeichenfolge ist