Detalles de tabla y columna en los resultados de la generación de perfiles

La página Resultados de la generación de perfiles de datos se puede dividir en tres partes.
  • Un encabezado, donde aparecen los detalles del perfil
  • El panel izquierdo, donde aparecen el nombre del perfil y todas las tablas y la columna incluidas en él
  • El panel del informe, donde aparece una vista gráfica de los datos analizados

El informe que aparece en el panel derecho se basa en lo que usted selecciona en el panel izquierdo (perfil, tabla o columna). Detalles, como Desviación estándar, Máximo (Máx), Mínimo (Mín) y Promedio se muestran en el nivel de columna para datos numéricos, en tanto que la frecuencia de longitud y la frecuencia de patrones de texto se muestran para columnas de cadena. Además, según las reglas seleccionadas para la generación de perfiles, se muestran pestañas adicionales en el informe, como Tipo de semántica para aquellas columnas que tienen valores de tipo de semántica si selecciona la regla Análisis de semántica. Para obtener más información, consulteReglas de generación de perfiles.

Además, puede trabajar de manera colaborativa en los resultados de generación de perfiles mediante la característica de comentarios que está disponible a nivel de modelo, tabla y columna. Para obtener más detalles, consulte Trabajo colaborativo en los resultados de la generación de perfiles de datos.

Detalles del perfil

En el encabezado del informe aparecen los siguientes detalles del perfil analizado.

  • Nombre de perfil: nombre del perfil
  • Descripción: una breve descripción del perfil
  • Iniciado: la fecha (aaaa/mm/dd), hora (hh:mm:ss) y período (AM o PM) de cuando se inició el análisis del perfil
  • Origen de datos: el origen de los datos en el perfil que se está analizando. Puede ser un modelo físico o lógico, o bien una conexión de origen de datos.
  • Usuario: el usuario que creó el perfil
  • Tablas: cantidad de tablas en el modelo seleccionado
  • Tipo de fuente de datos: indica si el origen de datos del perfil es un modelo o una base de datos.
  • Registros: cantidad total de registros analizados

Detalles de modelos y tablas

En el panel de navegación izquierdo de la página Resultados de la generación de perfiles de datos aparece el perfil analizado y las tablas y columnas incluidas en él. El informe visual mostrado en el panel derecho corresponde a la selección realizada en el panel izquierdo. Por ejemplo, si hace clic en el nombre del perfil, el informe muestra lo siguiente:
  • Resumen del perfil que muestra el porcentaje de filas completas e incompletas en los datos del perfil.
  • Información general de las tablas en los datos del perfil en la pestaña Resumen de tablas.
Puede usar la casilla de texto de escritura automática Buscar ubicada en el panel de navegación izquierdo para encontrar la tabla o columna relevante.
Nota: Para el tipo de datos de fecha, los resultados muestran la zona horaria del equipo del cliente.

Resultados de la generación de perfiles de datos

Según lo que seleccione en el panel izquierdo de esta página, estos informes aparecerán en el panel derecho.
  • Informe de análisis de perfil: haga clic en el nombre del origen de datos en el panel izquierdo para ver estos detalles:
    • Finalización: el porcentaje de finalización de las filas en los datos del perfil
    • Resumen de tablas: se muestran estos detalles de cada tabla en el perfil
      • Nombre de tabla: nombres de todas las tablas en el perfil
      • Cantidad de columnas: cantidad de columnas en la tabla
      • Cantidad de registros: cantidad de registros en la tabla
      • Finalización (%): nivel de detalle de los registros en la tabla
  • Informe de tablas: haga clic en cualquiera de los nombres de tabla en el panel izquierdo para ver estos detalles:
    Nota: En Archivo sin formato Generación de perfiles, puede hacer clic en la pestaña Registros malformados para ver este tipo de registros. En la pestaña, se muestran la Categoría y el Recuento de los registros malformados. Un registro se designa como malformado debido a las siguientes categorías:
    • Filas con una cantidad de campos menor que la cantidad de columnas definidas
    • Filas con una cantidad de campos mayor que la cantidad de columnas definidas

      También puede hacer clic en Categoría para mostrar una vista previa de los registros malformados. En la vista previa, se muestran el Número de registro, el Registro y la Razón para categorizar el registro como malformado.

    • Finalización: el porcentaje de finalización de filas en la tabla
    • Resumen de columnas: se muestran estos detalles de cada columna en la tabla
      • Nombre de columna: nombres de todas las columnas en la tabla
      • Tipo de columna: el tipo de datos en la columna
      • Finalización (%): finalización de registros en la columna
      • Singularidad (%): singularidad de los datos contenidos en la columna
      • Tipo detectado: muestra los tipos de semántica, como correo electrónico, teléfono, ciudad, nombre y apellido detectados en la cadena de esta columna.
    • Frecuencia de recuento nula: muestra el número de valores nulos en cada fila de la tabla
    Nota: Puede hacer clic en la pestaña Análisis de valor atípico para ver un resumen de los valores atípicos detectados en cada columna. En esta pestaña, se muestran las ocurrencias basadas en categorías de cualquier patrón, valor, longitud o frecuencia para una columna que no está en el rango de otras observaciones. Las categorías admitidas son Valores atípicos de longitud, Valores atípicos de frecuencia, Valores atípicos de patrón de texto, Valores atípicos numéricos, Valores atípicos de tipo semántico y Valores atípicos de tipo de datos.
  • Informe de columnas: haga clic en cualquiera de las columnas en el panel izquierdo para ver estos detalles:
    Nota: Puede hacer clic en la pestaña Valores atípicos para ver los valores atípicos detectados en una columna. Esta pestaña muestra una estructura con tabulación de valores atípicos detectados por categoría en la columna. También se muestran detalles como Patrón, Longitud, Valor o Frecuencia, Rango calculado y Ocurrencia.
    • Finalización: el porcentaje de finalización de los datos en la columna
    • Singularidad: qué tan únicos son los datos en la columna (%)
    • Longitud min. y Longitud máx. de los caracteres en caso de que los datos de la columna sean una cadena de caracteres
    • Desviación estándar (Stdev), Máximo (Max), Mínimo (Min) y valor Promedio en caso de que la columna tenga datos numéricos.
    • Frecuencia de los datos en la columna
    • Frecuencia de longitud en caso de que el tipo de datos de la columna sea una cadena de caracteres
    • Frecuencia de patrón de texto en caso de que el tipo de datos de la columna sea una cadena de caracteres