Estandarización de nombres personales

Este procedimiento muestra la forma de generar un flujo de datos que toma datos de nombres de personas (por ejemplo, "John P. Smith" ), identifica apodos comunes para el mismo nombre, y genera una versión normalizada del nombre que puede utilizarse entonces para consolidar registros redundantes.

Nota: Antes de comenzar, cerciórese de que sus datos de entrada tengan un campo denominado "Nombre" que contenga el nombre completo de la persona.
  1. Si aún no lo ha hecho, cargue las siguientes tablas en el servidor Spectrum™ Technology Platform:
    • Base de Open Parser
    • Nombres mejorados de Open Parser

    Use la utilidad de carga de bases de datos del módulo Data Normalization para cargar estas tablas. Para obtener instrucciones sobre la carga de tablas, consulte la Guía de instalación.

  2. Genere un nuevo flujo de datos en Enterprise Designer.
  3. Arrastre hacia el lienzo una etapa de origen.
  4. Haga doble clic en la etapa de origen y configúrela. Consulte la Guía de Dataflow Designer para obtener instrucciones acerca de cómo configurar etapas de origen.
  5. Arrastre hacia el lienzo una etapa Open Name Parser y conéctela a la etapa de origen.

    Por ejemplo, si está utilizando la etapa Read from File, su flujo de datos tendrá el siguiente aspecto:

  6. Arrastre hacia el lienzo la etapa Table Lookup y conéctela a la etapa Open Name Parser.

    Su flujo de datos debería tener ahora el siguiente aspecto:

  7. Haga doble clic en la etapa Table Lookup en el lienzo.
  8. En el campo Origen, seleccione FirstName.
  9. En el campo Destino, seleccione FirstName.

    Al especificar el mismo campo tanto como origen y como destino, el campo se actualizará con la versión normalizada del nombre.

  10. En el campo Tabla, seleccione NickNames.xml.
  11. Haga clic en Aceptar.
  12. Haga clic otra vez en Aceptar para cerrar la ventana de Opciones de Table Lookup.
  13. Arrastre hacia el lienzo una etapa receptora y conéctela a la etapa Table Lookup.

    Por ejemplo, si estuviera utilizando una etapa receptora Write to File, su flujo de datos tendría ahora el siguiente aspecto:

  14. Haga doble clic en la etapa receptora y configúrela. Consulte la Guía de Dataflow Designer para obtener instrucciones acerca de cómo configurar etapas de origen.

Ahora tiene un flujo de datos que toma nombres de personas y normaliza los nombres de pila, reemplazando los apodos con la forma normalizada del nombre.