Einführung in das Binning

Der „Binning“-Schritt führt das so genannte unbeaufsichtigte Binning durch, bei dem eine kontinuierliche Variable in Gruppen (Bins) unterteilt wird. Dabei werden keine objektiven Informationen berücksichtigt. Die erfassten Daten beinhalten Bereiche, Mengen und Prozentsätze von Werten der einzelnen Bereiche.

Zu den Vorteilen bei der Durchführung des Binnings zählen folgende:
  • Es lässt zu, dass Datensätze mit fehlenden Daten in das Modell eingeschlossen werden.
  • Es steuert bzw. verringert die Auswirkungen von Ausreißern innerhalb des Modells.
  • Es löst das Problem, dass die Merkmale verschiedene Skalierungen aufweisen. Dadurch können die Gewichtungen der Koeffizienten im Endmodell miteinander verglichen werden.

Sie können beim unbeaufsichtigten Binning der Spectrum™ Technology Platform Bins vom Typ „equal-width“ verwenden, bei denen die Daten in gleich große Bins unterteilt werden, oder in Bins vom Typ „equal-frequency“, bei denen die Daten in Gruppen aufgeteilt werden, die in etwa die gleiche Anzahl von Datensätzen enthalten. Im „Binning“-Schritt werden Bins vom Typ „equal-width“ als „Equal Range“-Bins und Bins vom Typ „equal-frequency“ als „Equal Population“-Bins bevorzugt.