Binning の概要

Binning ステージは、目標情報を考慮に入れずに、連続変数をグループ (ビン) に分類する、教師なしビニングとして知られる処理を実行します。取得されるデータには、レンジ、個数、各レンジ内の値の割合などがあります。

ビニングの実行には、次のような利点があります。

  • データが欠落しているレコードをモデルに含めることができる。
  • 外れ値がモデルに与える影響を制御または緩和することができる。
  • 最終モデルの係数の重みを同等にすることによって、特性によって尺度が異なる問題を解決する。

Spectrum™ Technology Platform の教師なしビニングでは、データを同じサイズのビンに分割する均等幅ビン、または、データをほぼ同数のレコードを含むグループに分割する均等個数ビンが使用できます。Binning ステージでは、均等幅ビンは、[Equal Ranges] ビン、均等個数ビンは、[Equal Count] ビンと呼ばれます。

Machine Learning モデル管理のビニング管理ツールを使用すると、より多くのビニング関数を実行できます。

コマンド ラインの命令を使用して、ビニングのリストを表示したり、ビニングを削除したりすることもできます。『管理ガイド』の「管理ユーティリティ」セクションにある「Binning」を参照してください。

注: Spectrum™ Technology Platform をバージョン 12.0 SP1 から 12.0 SP2 にアップグレードする場合は、Machine Learning モデル管理のビニング管理ツールですべてのアップグレード対象ビニングを手動で公開解除してから、それらを 12.0 SP2 での再ビニングのために使用する必要があります。従来の Binning ではなく、Binning Lookup でアップグレード対象ビニングを使用する場合、この手順は必要ありません。