Normalización de la terminología

El uso poco consistente de la terminología puede ser un problema para la calidad de los datos, y puede ocasionar problemas en el análisis y en las búsquedas, entre otros. Puede generar un flujo de datos que busque entre sus datos los términos que se usan en forma poco consistente y los normalice. Por ejemplo, si sus datos incluyen los términos "Incorporated", "Inc.", e Inc" en los nombres de la empresa, puede generar un flujo de datos para normalizar todo en una forma única (por ejemplo, "Inc.").

Nota: Antes de realizar este procedimiento, su administrador debe instalar la base de datos del módulo Data Normalization, la que contendrá los términos normalizados que desea aplicar a sus datos. Las instrucciones para la instalación de bases de datos pueden encontrarse en la Guía de instalación.
  1. Genere un nuevo flujo de datos en Enterprise Designer.
  2. Arrastre hacia el lienzo una etapa de origen.
  3. Haga doble clic en la etapa de origen y configúrela. Consulte la Guía de Dataflow Designer para obtener instrucciones acerca de cómo configurar etapas de origen.
  4. Arrastre hacia el lienzo una etapa Table Lookup y conéctela a la etapa de origen.

    Por ejemplo, si estuviera utilizando una etapa de origen Read from File, su flujo de datos tendría el siguiente aspecto:

  5. Haga doble clic en la etapa Table Lookup en el lienzo.
  6. Para especificar las opciones de Table Lookup, debe crear una regla. Puede crear múltiples reglas y luego especificar el orden en que quiere aplicarlas. Haga clic en Agregar para crear una regla.
  7. En el campo Acción, deje seleccionada la opción predeterminada Normalizar.
  8. En el campo Activo, deje seleccionado Completar campo si el campo completo es el término que desea normalizar. O bien, seleccione Términos individuales dentro de un campo para normalizar palabras individuales en dicho campo.
  9. En el campo Origen, seleccione el campo que desea normalizar.
  10. En el campo Destino, seleccione el campo que desea que contenga el término normalizado. Si especifica como campo de origen el mismo campo, el valor del campo de origen será reemplazado por el término normalizado.
  11. En el campo Tabla, seleccione la tabla que contenga los términos normalizados.
    Nota: Si no ve la tabla que necesita, comuníquese con su administrador de sistema. Debe estar cargada la base de datos del módulo Data Normalization.
  12. En el campo Cuando no se encuentre la entrada de tabla, defina el valor de destino en, seleccione Valor del origen.
  13. Haga clic en Aceptar.
  14. Defina reglas adicionales si desea normalizar valores en más campos. Cuando haya terminado de definir reglas, haga clic en Aceptar.
  15. Arrastre hacia el lienzo una etapa receptora y conéctela a Table Lookup.

    Por ejemplo, si estuviese usando Write to File, su flujo de datos tendrá el siguiente aspecto:

  16. Haga doble clic en la etapa receptora y configúrela.

    Para obtener información acerca de cómo configurar etapas receptoras, consulte la Guía de Dataflow Designer.

Ahora tiene un flujo de datos que normaliza términos.