Input

La etapa Import to Hub requiere que su flujo de datos contenga dos canales: uno que proporcione los datos para entidades que entran en el Puerto de entidad (el puerto superior) y uno que proporcione los datos para las relaciones que entran en el puerto de Relaciones (el puerto inferior). Este requisito se puede cumplir por dos etapas de origen (cada una de las cuales contiene un archivo de entrada), puede provenir de varias etapas de origen que desembocan en Record Combiner y, finalmente, se convierten en dos flujos o puede provenir de un archivo de origen cuyos datos pasan a través de Conditional Router o una etapa Splitter que da como resultado datos en dos flujos. No importa el método que use, siempre que el resultado final sea un canal de datos de entidad y un canal de datos de relación que pasa por la etapa Import to Hub.

Datos de entidad

Los datos que se incluyen en el Puerto de entidad deben incluir tanto el tipo de información y la ID de sus entidades. Puede tener un campo de Tipo ("persona") y un campo de ID ("Bob"), o solo un campo de ID que combina tanto la información de tipo y la ID, separados por dos puntos ("Persona:Bob"). Por ejemplo, el archivo puede tener un aspecto similar a los datos delimitados por comas a continuación. En el campo Tipo se muestra que las entidades son personas y lugares, y el campo ID proporciona los nombres de las personas y los lugares.

Alternativamente, el archivo de entrada podría contener un campo único que combina el tipo y la ID:

Nota: Los campos con datos de tipo e ID no necesariamente tienen que denominarse "Tipo" y "ID"; se admite cualquier nombre de campo.

Datos de relación

Los datos que se incluyen en el Puerto de relación deben incluir campos que identifican tipos de origen, ID de origen, tipos de objetivos, ID de destino y rótulo que identifican las relaciones entre los orígenes y los destinos. Tenga en cuenta que toda la información de entidad de origen y destino debe hacer referencia las entidades que se incluyen en el Puerto de entidad. Los datos de relación también pueden incluir las propiedades de las relaciones. Por ejemplo, el archivo podría tener un aspecto similar a los datos que se muestran a continuación. En este caso, en el campo SourceType se muestra que todos los orígenes son personas y en el campo TargetType se muestra que los objetivos son personas y lugares. En el campo SourceID se proporcionan los nombres de todos los orígenes y en el campo TargetID se proporcionan nombres de personas y lugares. En el campo Rótulo se identifican las relaciones, en este caso, "trabaja con", "trabaja en" o "vive en".

Requisitos de orden

La etapa Import to Hub requiere que la entrada de datos se ordenen de una manera determinada. La entidad de archivo de entrada se debe ordenar primero según tipo y después según ID en forma ascendente. Los datos de la entidad que se mostraron antes incluyen los campos necesarios, pero no están ordenados correctamente. Con el fin de que Import to Hub funcione correctamente, los datos de la entidad tendrían que tener este aspecto:
O esto, para los campos combinados:
El archivo de entrada de relación también debe estar ordenado. Si los datos de relación incluyen tanto el tipo y la ID en el mismo campo, el archivo de entrada se debe ordenar de la siguiente forma en orden ascendente:
  • Tipo de origen/ID
  • Tipo de destino/ID.
  • Rótulo
  • Unique ID Generator (opcional)
Si los datos de relación contienen información de tipo en un campo distinto, el archivo de entrada se debe ordenar de forma ascendente con un desglose de esos campos:
  • Tipo de origen
  • ID de origen
  • Tipo de destino
  • ID de destino
  • Rótulo
  • Unique ID Generator (opcional)
Al igual que los datos de la entidad, los datos de relación que se muestran incluyen los campos necesarios, pero no están ordenados correctamente. Con el fin de que Import to Hub funcione correctamente, los datos de la relación tendrían que tener este aspecto:
O esto, para los campos combinados: