Ejemplo de archivo XML

Configuración de Read from XML

El flujo de datos de Write to Hub que utiliza un archivo XML para la entrada tiene esta apariencia:

La etapa Read from XML utiliza un archivo jerárquico que contiene los siguientes elementos:

La etapa Read from XML aparece de la siguiente manera cuando se configura para trabajar con este archivo de entrada:

A continuación se configura la etapa Write to Hub. Después de asignar al modelo el nombre "Empleados" ("Employees" en el ejemplo), la etapa se configura para incluir las entidades y relaciones que conforman el modelo.

Como estamos creando un modelo que es similar a un cuadro organizativo, nuestras entidades son empleados a los que se les asignan IDs numéricas. En primer lugar, en el cuadro de diálogo Agregar entidad hay que hacer clic en el botón Examinar para acceder al cuadro de diálogo Esquema de campo, y luego seleccionar "Id.". Este será el primer grupo de entidades en nuestro modelo.

A continuación, definimos el campo Tipo con el valor "Employee" (Empleado) y marcamos las casillas de nombre o título porque deseamos que los datos de esos campos se incluyan como propiedades para las entidades ID en el modelo.

Después de configurar las propiedades para la entidad ID, debemos configurar las opciones de procesamiento. La ficha Actualizaciones permite especificar si las propiedades pueden actualizarse en el modelo después de implementarse y si deben sobrescribirse por encima de los datos ya existentes. Por ejemplo, en nuestro ejemplo Mary Hansen se encontrará dos veces porque para la ID 2 es una empleada pero para la ID 11 es una gerente. Cuando la etapa Write to Hub procese a Mary por segunda vez, existe la posibilidad de que sobrescriba o elimine los datos que se habían completado durante el primer procesamiento de Mary. Al seleccionar No reemplazar nunca propiedades por datos vacíos (la opción predeterminada), todas las actualizaciones que se realicen crearán nuevas propiedades y sobrescribirán las propiedades anteriores, pero no eliminarán propiedades que se definieron para la primera instancia de encuentro y faltan en una segunda instancia. Esto también permite asegurarse de que el orden en el que se leen los registros no impacte en el modelo.

Si se seleccionara la opción Actualizar siempre propiedades, los datos siempre se sobrescribirían y solo el último conjunto de datos de propiedades se reflejaría en el modelo. Si se seleccionara la opción Actualizar propiedades a menos que todos los datos de entrada sean nulos, los datos siempre se sobrescribirían a menos que todos los campos del nuevo registro estuviesen en blanco. Por último, si se seleccionara la opción No invalidar nunca propiedades que no están vacías, el primer conjunto de datos de cualquier campo dado se conservaría a menos que el campo esté en blanco. En ese caso, se conservaría el primer conjunto de datos que no están en blanco.

Estos pasos se repiten para agregar "ManagerId" (ID de gerente) como el segundo grupo de entidades en el modelo. Si bien ManagerID y EmployeeID son campos diferentes en el archivo de entrada, ambos tipos de entidades se definen como “Employee”. Si definimos ManagerID en un tipo diferente, el modelo contendrá dos entidades en gerentes de nivel medio. Por ejemplo, Jim Waterman tendría una entidad como empleado y una entidad como gerente. Con ambas entidades definidas como entidades de tipo "Empleado", los gerentes de nivel intermedio como Jim Waterman tendrán solo una entidad en el modelo. Esa entidad tendrá otras incluidas (de los empleados) y otra derivada (al gerente respectivo). Cabe señalar que no se agregan propiedades a las entidades ManagerID porque los valores de esos campos (nombre, título, etc.) corresponden a los empleados, no a los gerentes. Asimismo, se acepta la opción predeterminada No reemplazar nunca propiedades por datos vacíos en la ficha Actualizaciones.

La ficha Entidades completa para este ejemplo aparece a continuación:

A continuación configuraremos la ficha Relaciones. Lo primero que debemos hacer en el cuadro de diálogo Agregar relación es seleccionar el origen de la relación de la lista de entidades creada en la ficha Entidades. La relación entre nuestras entidades refleja la estructura de subordinación (empleado a gerente). por lo tanto, seleccionaremos la entidad "Employee:Staff/Employee/Staff-id" como origen. Luego, seleccionamos "cadena" como nombre de la relación, e ingresamos el texto "Subordinado a". Luego de eso, seleccionamos el destino de la relación en la lista de entidades creadas en la ficha Entidades; en nuestro ejemplo, seleccionamos "Employee:id." Si estuviésemos usando la relación "gerente" en lugar de la relación "subordinado a", invertiríamos las selecciones en los campos de origen y destino.

La ficha Relaciones completa para este ejemplo aparece a continuación:

La configuración de este flujo de datos ya está completa y ha generado el siguiente modelo, según se describe en el Cliente de análisis de relaciones:

Al igual que en el ejemplo de archivo plano, este modelo también puede visualizarse en el estilo de panel , tal como se muestra a continuación.