Konfigurieren erweiterter Optionen

  1. Lassen Sie Konstante Felder ignorieren aktiviert, damit Felder übersprungen werden, die für die einzelnen Datensätze die gleichen Werte enthalten.
  2. Lassen Sie p-Werte berechnen aktiviert, um p-Werte für die Parameterschätzungen zu berechnen.
  3. Lassen Sie Kollineare Spalte entfernen aktiviert, damit kollineare Spalten während der Modellerstellung automatisch entfernt werden. Dies führt zu einem Koeffizienten von 0 im zurückgegebenen Modell.
    Diese Option muss aktiviert werden, wenn p-Werte berechnen ebenfalls aktiviert ist.
  4. Lassen Sie Konstanten Begriff einschließen (abfangen) aktiviert, um einen konstanten Begriff im Modell einzuschließen (abzufangen).
    Dieses Feld muss aktiviert werden, wenn Kollineare Spalte entfernen ebenfalls aktiviert ist.
  5. Wählen Sie einen Solver aus der Dropdown-Liste aus. Beachten Sie, dass COORDINATE_DESCENT und COORDINATE_DESCENT_NAIVE derzeit experimentell sind.
    AUTO
    Solver wird basierend auf Eingabedaten und Parametern bestimmt.
    COORDINATE_DESCENT
    IRLSM mit der Version der Kovarianzaktualisierungen der zyklischen Koordinate, die aus der innersten Schleife stammt.
    COORDINATE_DESCENT_NAIVE
    IRLSM mit der Version der naiven Aktualisierungen der zyklischen Koordinate, die aus der innersten Schleife stammt.
    IRLSM
    Ideal für Probleme mit einer geringen Anzahl von Prädiktoren oder Lambda-Suchvorgänge mit L1-Penalty.
    L_BFGS
    Ideal für Datasets mit vielen Spalten.
  6. Lassen Sie Seed für N-fach aktiviert, und geben Sie einen numerischen Ausgangswert ein, um sicherzustellen, dass die Darstellung der Daten bei jeder Datenflussausführung gleich ist, wenn diese in Test- und Trainingsdaten aufgeteilt werden. Lassen Sie den Wert „0“ in diesem Feld, damit die Aufteilung bei jeder Datenflussausführung beliebig erfolgt.
  7. Aktivieren Sie N-fach und geben Sie die Anzahl der Folds ein, wenn Sie eine Kreuzvalidierung durchführen.
  8. Aktivieren Sie Foldzuweisung, und wählen Sie aus der Dropdown-Liste aus, ob Sie eine Kreuzvalidierung durchführen. Dieses Feld ist nur anwendbar, wenn Sie unter N-fach einen Wert eingegeben haben und Foldfeld nicht angegeben ist.
    AUTO

    Lässt zu, dass der Algorithmus automatisch eine Option auswählt; derzeit wird „Random“ verwendet.

    Modulo

    Teilt das Dataset gleichmäßig auf die Folds auf und ist nicht vom Ausgangswert abhängig.

    Random

    Teilt die Daten zufällig in „N-fach“-Bestandteile ein; diese Einstellung ist für umfangreiche Datasets am besten geeignet.

    Stratified

    Schichtet die Folds basierend auf der Antwortvariable für Klassifizierungsprobleme. Verteilt Beobachtungen aus den verschiedenen Klassen gleichmäßig auf alle Datasets, wenn ein Dataset in Trainings- und Testdaten aufgeteilt wird. Dies kann nützlich sein, wenn viele Klassen vorhanden sind und das Dataset relativ klein ist.

  9. Wenn Sie eine Kreuzvalidierung durchführen, aktivieren Sie Foldfeld und wählen Sie aus der Dropdown-Liste das Feld aus, das die Foldindexzuweisung für die Kreuzvalidierung enthält.
    Dieses Feld ist nur anwendbar, wenn Sie unter N-fach und Foldzuweisung keinen Wert eingegeben haben.
  10. Aktivieren Sie Max. Iterationen und geben Sie die Anzahl der Trainingsiterationen ein, die erfolgen sollen.
  11. Aktivieren Sie Ziel-Epsilon und geben Sie den Schwellenwert für die Konvergenz an. Dieser Wert musst zwischen 0 und 1 liegen. Wenn der Zielwert geringer ist als dieser Schwellenwert, wird das Modell konvergiert.
  12. Aktivieren Sie Beta-Epsilon und geben Sie den Schwellenwert für die Konvergenz an. Dieser Wert musst zwischen 0 und 1 liegen. Wenn der Zielwert geringer ist als dieser Schwellenwert, wird das Modell konvergiert. Wenn die L1-Normalisierung der aktuellen Beta-Änderung unter diesem Schwellenwert liegt, sollten Sie die Verwendung der Konvergenz in Erwägung ziehen.
  13. Klicken Sie auf OK, um das Modell und die Konfiguration zu speichern, oder fahren Sie mit der nächsten Registerkarte fort.