Configuración de opciones básicas
-
Ingrese la Cantidad de árboles máxima en su modelo. El valor predeterminado es 50.
-
Ingrese la Profundidad máxima o la cantidad máxima de niveles que desea que tenga su modelo. El valor predeterminado es 5.
-
Ingrese la Cantidad mínima de filas; es decir, la cantidad mínima de registros (filas) que desea que tenga su modelo. El valor predeterminado es 10.
-
Ingrese la Cantidad de contenedores numéricos; es decir, la cantidad de contenedores que desea que genere el histograma y que luego divida en el mejor punto. El valor predeterminado es 20.
-
Ingrese la Cantidad de contenedores de nivel superior; es decir, la cantidad mínima de contenedores que desea tener a nivel de raíz. El valor predeterminado es 1024.
-
Ingrese la Cantidad de contenedores de categoría; es decir, la cantidad máxima de contenedores que desea que genere el histograma y que luego divida en el mejor punto. El valor predeterminado es 1024.
-
Revise la Tasa de muestra e ingrese el porcentaje de filas que se usarán como una muestra en cada árbol. Lo anterior puede ser un valor entre 0,0 y 1,0.
-
Revise la Tasa de muestra de columna por árbol e ingrese la tasa de muestra de columna para cada árbol. Lo anterior puede ser un valor entre 0,0 y 1,0.
-
Columnas en cada nivel especifica las columnas para seleccionar al azar en cada nivel. Si esta opción no está marcada, se usa el valor predeterminado de -1 y el número de variables es la raíz cuadrada del número de columnas para clasificación y p/3 para regresión (donde p es el número de predictores). Si marca la opción, es posible especificar un valor igual o mayor que 1. El valor especificado no puede ser mayor que el número de predictores.
-
Marque la opción Calificar datos de entrada para agregar una columna para la predicción del modelo (calificación) a los datos de entrada.
-
Especifique un valor entre 1 y 100 como Porcentaje para datos de capacitación cuando los datos de entrada se dividen aleatoriamente en muestras de datos de capacitación y de prueba.
-
Ingrese el valor de 100 menos la cantidad que ingresó en el Paso 5 como Porcentaje para datos de prueba.
-
Utilice el campo Propagar para datos de prueba para garantizar que cuando los datos se dividan en datos de prueba y de capacitación, siempre se produzca de la misma manera cada vez que ejecute el flujo de datos. Desmarque este campo para obtener una división aleatoria cada vez que ejecuta el flujo.
-
Haga clic en Aceptar para guardar el modelo y la configuración, o continúe a la ficha siguiente.