Introducción a Data Quality

Data Quality implica garantizar la exactitud, puntualidad, integridad y consistencia de los datos utilizados por una organización, de modo tal que dichos datos son aptos para ser utilizados. Spectrum™ Technology Platform respalda las iniciativas de calidad de datos al proporcionar las siguientes capacidades.

Análisis

El análisis es el proceso a través del cual se evalúa una secuencia de caracteres de entrada en un campo y se disemina en varios campos. Por ejemplo, podría existir un campo llamado Nombre que contenga el valor "John A. Smith". Mediante el análisis, se puede dividir para tener un campo FirstName que contenga "John", un campo MiddleName que contenga "A" y un campo LastName que contenga "Smith".

Plantillas de flujo de datos para comparación

Normalización toma datos del mismo tipo y los pone en el mismo formato. Algunos tipos de datos que pueden normalizarse incluyen números telefónicos, fechas, nombres, direcciones y números identificatorios. Por ejemplo, los números telefónicos pueden formatearse de manera tal que se eliminen los caracteres no numéricos tales como paréntesis, puntos o guiones.

Es recomendable que realice la normalización de sus datos antes de realizar actividades de cruce o de desduplicación, puesto que los datos normalizados experimentarán cruces más exactos que los datos con inconsistencias en su formato.

Comparación

El cruce es el proceso de identificar registros relacionados entre sí en cierta forma que tenga significado para sus propósitos. Por ejemplo, si intenta eliminar información redundante de los datos de su cliente, puede que desee identificar los registros duplicados de dicho cliente; o, si intenta evitar que el mismo material de marketing se envíe dos veces a la misma dirección, es posible que desee identificar los registros de clientes que habitan en el mismo hogar.

Desduplicación

La desduplicación identifica registros que representan a una entidad, pero que por alguna razón fueron ingresados varias veces en el sistema, en ocasiones con datos con leves diferencias. Por ejemplo, su sistema puede contener información de proveedores de distintos departamentos de su organización, usando cada departamento, para el mismo proveedor, una Id. de proveedor diferente. Al usar Spectrum™ Technology Platform puede consolidar esos registros en un único registro de cada proveedor.

Revisión de registros de excepción

En ciertos casos es posible que cuente con datos que no pueden procesarse automáticamente de manera confidencial y que deben ser revisados por un administrador de datos que esté informado. Algunos ejemplos de registros que pueden requerir de revisión manual incluyen los siguientes:
  • Fallas en la verificación de direcciones
  • Fallas de geocodificación
  • Cruces con bajo nivel de confianza
  • Decisiones de combinación/consolidación

El módulo Business Steward es un conjunto de funciones que permiten identificar y resolver registros de excepciones.