基本オプションの設定
- [ツリーの数] に、お使いのモデルでのツリー数の最大値を入力します。
-
[最大深度] を入力します。
これは、モデルに含めるレベルの最大数を示します。
-
[最小行数] を入力します。
これは、モデルに含める行 (またはレコード) の最小数を示します。
-
[ビンの数] を入力します。
これは、ヒストグラムを構築したうえで最良のポイントで分割するビンの数を示します。
-
[ビンの数 (最上位レベル)] を入力します。
これは、ルート レベルで必要なビンの最小数を示します。
-
[ビンの数 (カテゴリ別)] を入力します。
これは、ヒストグラムを構築したうえで最良のポイントで分割するビンの最大数を示します。
-
[サンプル レート] をオンにし、各ツリーでサンプルとして使用される行の比率を入力します。
0.0 ~ 1.0 の値を使用できます。
-
[各ツリーの列サンプル レート] をオンにし、各ツリーの列に対するサンプリング率を入力します。
0.0 ~ 1.0 の値を使用できます。
-
[各レベルの列数] をオンにし、すべてのレベルでの列のサンプリングに対する相対変化量を入力します。
有効な値の範囲は、1.0 から、選択した入力予測因子の数値までです。デフォルトは 1.0 です。
-
モデル予測 (スコア) を表す列を入力データに追加するには、[入力データを記録] をオンにします。
注: [モデルのプロパティ] タブで [多項レベル] をオンにした場合はこのオプションが無効になっています。
- 入力データがトレーニングおよびテストのデータ サンプルにランダムに分割される場合は、1 ~ 100 の値を [トレーニング データの比率] に指定します。
- ステップ 11 で指定した値を 100 から引いた値を [テスト データの比率] に入力します。
- [テスト データ用シード] により、データフローを何度実行してもデータが必ず同じ方法でテスト データとトレーニング データに分割されるようになります。フローを実行するたびにランダムな分割を行う場合は、このフィールドをオフにします。
- [OK] をクリックして、モデルと設定を保存するか、次のタブで操作を続行します。