Ajuste de tamaño de colección e instancias de tiempo de ejecución

Dos de las configuraciones primarias que puede utilizar para mejorar el rendimiento son el tamaño de colección de recursos de la base de datos y las instancias de ejecución de la etapa. Siga este procedimiento para realizar pruebas para determinar el tamaño de colección óptimo y la configuración de instancias de ejecución para su entorno.

  1. Identifique los datos de entrada que usará para las pruebas de rendimiento. Cuando elija datos para utilizar al realizar pruebas de rendimiento, considere lo siguiente.
    • Es importante que los datos de prueba contengan suficientes registros de que el tiempo de ejecución se puede medir y se puede validar su consistencia.
    • Asegúrese de que los datos de prueba sean representativos de los datos reales que desea procesar. Por ejemplo, si realiza pruebas de rendimiento para geocodificación, asegúrese de que sus datos de prueba tengan un número igual de registros para todos los países que desea geocodificar.
  2. Si está probando un servicio o flujo de datos que requiere el uso de un recurso de base de datos, como bases de datos postales o bases de datos de geocodificación, asegúrese de tener la versión más reciente de la base de datos instalada.
  3. Cree un flujo de datos que lea datos de un archivo, los procese con la etapa que desea optimizar y los escriba en un archivo.

    Por ejemplo, si desea probar la configuración de rendimiento para Validate Address, cree un flujo de datos que conste de Read from File, Validate Address y Write to File.

  4. De manera predeterminada, los flujos de datos se configuran con un tamaño de colección de 8. Si espera tener más de ocho instancias simultáneas del flujo de datos para ejecutar, optimice la configuración de tamaño de colección del flujo de datos. Para obtener instrucciones, consulte Cómo configurar el tamaño de colección de flujo de datos.
  5. Establezca el tamaño de colección de recursos de la base de datos en 1. Para obtener instrucciones acerca de la configuración del tamaño de colección de un recurso de base de datos, consulte Cómo configurar el tamaño de colección del recurso de base de datos.
  6. Establezca las instancias de ejecución de la etapa en 1. Para obtener instrucciones acerca de las instancias de ejecución de la etapa, consulte Configuración de instancias de ejecución locales.
  7. Calcule el rendimiento del punto de referencia ejecutando el flujo de datos varias veces y registrando el promedio para cada uno de los siguientes:
    • Tiempo transcurrido
    • Utilización del CPU
    • Utilización de la memoria
    Consejo: Puede utilizar la consola JMX para supervisar el rendimiento. Para obtener más información, consulteCómo controlar el rendimiento con la consola JMX.
  8. Ejecute múltiples instancias del trabajo simultáneamente, si este es un caso de uso que debe admitirse. Registre el tiempo transcurrido, la utilización del CPU y la utilización de la memoria para cada escenario.
    Consejo: Puede utilizar un monitor de archivo para ejecutar múltiples instancias de un trabajo a la vez. Para obtener más información, consulteActivación de un flujo con un archivo de control.
  9. Aumente el tamaño de colección del recurso de la base de datos y la configuración de las instancias de ejecución de la etapa.
  10. Reinicie el servidor.
  11. Ejecute nuevamente el flujo de datos, registrando el tiempo transcurrido, la utilización del CPU y la utilización de la memoria.
  12. Continúe para aumentar el tamaño de colección del recurso de la base de datos y las instancias de ejecución de la etapa hasta que comience a ver una disminución en el rendimiento.
  13. Si está probando el rendimiento de la geocodificación, repita este procedimiento utilizando una entrada de país simple y múltiple.