Konfigurieren erweiterter Optionen
- Lassen Sie Konstante Felder ignorieren aktiviert, damit Felder übersprungen werden, die für die einzelnen Datensätze die gleichen Werte enthalten.
- Lassen Sie p-Werte berechnen aktiviert, um p-Werte für die Parameterschätzungen zu berechnen.
-
Lassen Sie Kollineare Spalte entfernen aktiviert, damit kollineare Spalten während der Modellerstellung automatisch entfernt werden. Dies führt zu einem Koeffizienten von 0 im zurückgegebenen Modell.
Diese Option muss aktiviert werden, wenn p-Werte berechnen ebenfalls aktiviert ist.
-
Lassen Sie Konstanten Begriff einschließen (abfangen) aktiviert, um einen konstanten Begriff im Modell einzuschließen (abzufangen).
Dieses Feld muss aktiviert werden, wenn Kollineare Spalte entfernen ebenfalls aktiviert ist.
-
Wählen Sie einen Solver aus der Dropdown-Liste aus. Beachten Sie, dass COORDINATE_DESCENT und COORDINATE_DESCENT_NAIVE derzeit experimentell sind.
- AUTO
- Solver wird basierend auf Eingabedaten und Parametern bestimmt.
- COORDINATE_DESCENT
- IRLSM mit der Version der Kovarianzaktualisierungen der zyklischen Koordinate, die aus der innersten Schleife stammt.
- COORDINATE_DESCENT_NAIVE
- IRLSM mit der Version der naiven Aktualisierungen der zyklischen Koordinate, die aus der innersten Schleife stammt.
- IRLSM
- Ideal für Probleme mit einer geringen Anzahl von Prädiktoren oder Lambda-Suchvorgänge mit L1-Penalty.
- L_BFGS
- Ideal für Datasets mit vielen Spalten.
- Lassen Sie Seed für N-fach aktiviert, und geben Sie einen numerischen Ausgangswert ein, um sicherzustellen, dass die Darstellung der Daten bei jeder Datenflussausführung gleich ist, wenn diese in Test- und Trainingsdaten aufgeteilt werden. Lassen Sie den Wert „0“ in diesem Feld, damit die Aufteilung bei jeder Datenflussausführung beliebig erfolgt.
- Aktivieren Sie N-fach und geben Sie die Anzahl der Folds ein, wenn Sie eine Kreuzvalidierung durchführen.
-
Aktivieren Sie Foldzuweisung, und wählen Sie aus der Dropdown-Liste aus, ob Sie eine Kreuzvalidierung durchführen. Dieses Feld ist nur anwendbar, wenn Sie unter N-fach einen Wert eingegeben haben und Foldfeld nicht angegeben ist.
- AUTO
-
Lässt zu, dass der Algorithmus automatisch eine Option auswählt; derzeit wird „Random“ verwendet.
- Modulo
-
Teilt das Dataset gleichmäßig auf die Folds auf und ist nicht vom Ausgangswert abhängig.
- Random
-
Teilt die Daten zufällig in „N-fach“-Bestandteile ein; diese Einstellung ist für umfangreiche Datasets am besten geeignet.
- Stratified
-
Schichtet die Folds basierend auf der Antwortvariable für Klassifizierungsprobleme. Verteilt Beobachtungen aus den verschiedenen Klassen gleichmäßig auf alle Datasets, wenn ein Dataset in Trainings- und Testdaten aufgeteilt wird. Dies kann nützlich sein, wenn viele Klassen vorhanden sind und das Dataset relativ klein ist.
-
Wenn Sie eine Kreuzvalidierung durchführen, aktivieren Sie Foldfeld und wählen Sie aus der Dropdown-Liste das Feld aus, das die Foldindexzuweisung für die Kreuzvalidierung enthält.
Dieses Feld ist nur anwendbar, wenn Sie unter N-fach und Foldzuweisung keinen Wert eingegeben haben.
- Aktivieren Sie Max. Iterationen und geben Sie die Anzahl der Trainingsiterationen ein, die erfolgen sollen.
- Aktivieren Sie Ziel-Epsilon und geben Sie den Schwellenwert für die Konvergenz an. Dieser Wert musst zwischen 0 und 1 liegen. Wenn der Zielwert geringer ist als dieser Schwellenwert, wird das Modell konvergiert.
- Aktivieren Sie Beta-Epsilon und geben Sie den Schwellenwert für die Konvergenz an. Dieser Wert musst zwischen 0 und 1 liegen. Wenn der Zielwert geringer ist als dieser Schwellenwert, wird das Modell konvergiert. Wenn die L1-Normalisierung der aktuellen Beta-Änderung unter diesem Schwellenwert liegt, sollten Sie die Verwendung der Konvergenz in Erwägung ziehen.
- Klicken Sie auf OK, um das Modell und die Konfiguration zu speichern, oder fahren Sie mit der nächsten Registerkarte fort.