Clasificación de registros con Sorter

La etapa Sorter permite ordenar los registros utilizando los campos que usted especifique.

  1. En Etapas de control, arrastre Sorter hacia el lienzo ubicándola donde desee en el flujo de datos.
  2. Haga doble clic en Sorter.
  3. Haga clic en Agregar.
  4. Haga clic en la flecha hacia abajo en la columna Nombre del campo y seleccione el campo en el que desee clasificar.
    Nota: La lista de campos disponibles se basa en los campos que se utilizan en las etapas anteriores en el flujo de datos.
  5. En la columna Clasificar, elija si desea clasificar en orden ascendente o descendente.
  6. En la columna Tipo, seleccione el tipo de datos del campo.
    Nota: Si los datos de entrada no están en formato de cadena, la columna Tipo estará desactivada.
    bigdecimal
    Un tipo de dato numérico que admite 38 puntos decimales de precisión. Utilice este tipo de datos para datos que se usarán en cálculos matemáticos que requieren un alto grado de precisión, especialmente aquellos que implican datos financieros. El tipo de datos bigdecimal es compatible con cálculos más precisos que el tipo de datos double.
    double
    Un tipo de dato numérico que contiene números de doble precisión tanto negativos como positivos entre 2-1074 y (2-2-52)×21023. En notación científica, el rango de valores es - 1.79769313486232E+308 a 1.79769313486232E+308.
    float
    Un tipo de dato numérico que contiene números de precisión simple tanto negativos como positivos entre 2-149 y (2-223)×2127. En notación científica, el rango de valores es - 3.402823E+38 a 3.402823E+38.
    integer
    Un tipo de datos numérico que contiene números enteros positivos y negativos entre -231 (-2,147,483,648) y 231-1 (2,147,483,647).
    long
    Un tipo de datos numérico que contiene números enteros positivos y negativos entre -263 (-9,223,372,036,854,775,808) y 263-1 (9,223,372,036,854,775,807).
    string
    Secuencia de caracteres.
  7. Para eliminar los espacios en blanco a la izquierda y a la derecha de un valor antes de la ordenación, seleccione la casilla de verificación de la columna Recortar. La opción recortar no modifica el valor del campo. Solamente recorta el valor para realizar la ordenación. Tome en cuenta que si los datos de entrada no están en formato de cadena, la columna Recortar estará desactivada.
  8. En la columna Tratar nulo como, seleccione Más grande o Más pequeño para indicar la ubicación de los valores nulos en la lista ordenada. La ubicación depende de la combinación de opciones que se seleccionen en los campos Ordenar y Tratar nulo como, como se muestra en la tabla que figura a continuación:
    Orden Tratar nulo como Ubicación de los valores nulos en la lista ordenada
    Ascendente El más grande Parte inferior de la lista
    Ascendente El más pequeño Parte superior de la lista
    Descendente El más grande Parte superior de la lista
    Descendente El más pequeño Parte inferior de la lista
  9. Repita hasta que haya agregado todos los campos que desee clasificar.
  10. Reorganice el orden de clasificación como desee haciendo clic en Arriba o Abajo Esto permite clasificar primero por un campo, y luego ordenar la clasificación resultante según otro campo.
  11. Si desea anular las opciones de rendimiento de la clasificación predeterminada que han sido definidas por el administrador, haga clic en Opciones avanzadas , marque la casilla Anular las opciones de rendimiento de orden predeterminadas, y luego especifique las siguientes opciones:
    Límite de registros en memoria
    Especifica la cantidad máxima de filas de datos que un ordenador guardará en la memoria antes de empezar la paginación al disco. De forma predeterminada, la ordenación de 10.000 registros o menos se realizará en la memoria y la de más de 10.000 registros se realizará como una ordenación en disco. El límite máximo es de 100.000 registros. Normalmente, la ordenación que se realiza en la memoria es más rápida que la que se realiza en disco; por lo tanto, este valor se debe establecer lo suficientemente alto para que la mayor parte de la ordenación sea en la memoria y solo los conjuntos de datos grandes se escriban en el disco.
    Nota: Tenga cuidado en entornos en los que se ejecuten trabajos de forma concurrente, porque aumentar la configuración del Límite de registros en memoria aumenta las posibilidades de agotar la memoria.
    Número máximo de archivos temporales
    Especifica el número máximo de archivos temporales que puede utilizar el proceso de orden. El uso de una gran cantidad de archivos temporales puede producir un mejor rendimiento. Sin embargo, la cantidad óptima depende en gran medida de la configuración en el servidor que ejecuta Spectrum™ Technology Platform. Debe experimentar distintas configuraciones y observar el efecto en el rendimiento de usar una mayor o menor cantidad de archivos temporales. Para calcular la cantidad aproximada de archivos temporales que se pueda necesitar , use la siguiente ecuación:
    (NumberOfRecords × 2) ÷ InMemoryRecordLimit = NumberOfTempFiles 
    Tenga en cuenta que la cantidad máxima de archivos temporales no puede ser superior a 1.000.
    Activar compresión
    Especifica que los archivos temporales se comprimen cuando se los escribe en el disco.
    Nota: La configuración del rendimiento óptimo de orden depende de la configuración del hardware de su servidor. No obstante, la siguiente ecuación generalmente produce un buen rendimiento de orden:
    (InMemoryRecordLimit × MaxNumberOfTempFiles ÷ 2) >= TotalNumberOfRecords
  12. Haga clic en Aceptar.
    Nota: Puede eliminar los criterios de clasificación según lo desee destacando una fila y haciendo clic en Eliminar.