Configuración de opciones avanzadas

  1. Deje marcada la opción Ignorar campos constantes para omitir campos que tienen el mismo valor para cada registro.
  2. Marque la opción Calcular valores de p para calcular valores de p a fin de obtener las estimaciones de parámetros.
  3. Marque la opción Quitar columna alineada para quitar automáticamente las columnas alineadas durante la construcción del modelo. Esto dará como resultado un coeficiente de 0 en el modelo devuelto.
    Esta opción debe estar marcada si la opción Calcular valores de p también está marcada.
  4. Deje marcada la opción Incluir término constante (interceptar) para incluir un término constante (interceptar) en el modelo.
    Debe marcar este campo si también marca la opción Quitar columna alineada.
  5. Seleccione un Solucionador de la lista desplegable. Tenga en cuenta que CoordinateDescent y CoordinateDescentNaive se encuentran en etapa experimental.
    Automático
    El solucionador se determinará en función de los datos y parámetros de entrada.
    CoordinateDescent
    IRLSM con la versión de actualizaciones de covarianza del descenso cíclico por coordenadas en el bucle interior.
    CoordinateDescentNaive
    IRLSM con la versión de actualizaciones naive del descenso cíclico por coordenadas en el bucle interior.
    IRLSM
    Ideal para problemas con una pequeña cantidad de predictores o para búsquedas Lambda con penalidad L1.
    LBFGS
    Ideal para conjuntos de datos con muchas columnas.
  6. Deje marcada la opción Propagar para N iteraciones e ingrese el número de propagación para garantizar que cuando los datos se dividan en datos de prueba y de capacitación, esto ocurra siempre de la misma manera cada vez que ejecute el flujo de datos. Desmarque este campo para obtener una división aleatoria cada vez que ejecuta el flujo.
  7. Marque la opción N iteraciones e ingrese la cantidad de iteraciones si va a realizar una validación cruzada.
  8. Haga clic en Asignación de iteración y seleccione de la lista despegable si está ejecutando una validación cruzada. Este campo solo se aplica si ingresó un valor en N iteraciones y no se especificó el Campo de iteración.
    Automático

    Permite que el algoritmo seleccione automáticamente una opción; actualmente utiliza Aleatorio.

    Módulo

    Divide de manera uniforme el conjunto de datos en las iteraciones y no depende de la raíz.

    Aleatorio

    Divide de manera aleatoria los datos en piezas de n iteraciones; es ideal para grandes conjuntos de datos.

  9. Si está ejecutando una validación cruzada, marque la opción Campo de iteración y seleccione el campo que contiene la asignación del índice de iteración de validación cruzada en la lista desplegable.
    Este campo solo se aplica si no ingresó un valor en N iteraciones y Asignación de iteración.
  10. Marque la opción Iteración máxima e ingrese el número de iteraciones de capacitación que deben ocurrir.
  11. Marque la opción Objetivo épsilon e ingrese el umbral de convergencia; este debe ser un valor entre 0 y 1. Si el valor objetivo es menor que este umbral, el modelo se convergerá.
  12. Marque la opción Beta épsilon e ingrese el umbral de convergencia; este debe ser un valor entre 0 y 1. Si el valor objetivo es menor que este umbral, el modelo se convergerá. Si la normalización L1 del cambio beta actual está por debajo de este umbral, considere el uso de la convergencia.
  13. Haga clic en Aceptar para guardar el modelo y la configuración, o continúe a la ficha siguiente.