基本オプションの設定

[ツリーの数] に、お使いのモデルでのツリー数の最大値を入力します。デフォルトは 50 です。
[最大深度] を入力します。
これは、モデルに含めるレベルの最大数を示します。デフォルトは 5 です。
[最小行数] を入力します。
これは、モデルに含める行 (またはレコード) の最小数を示します。デフォルトは 10 です。
[ビンの数] を入力します。
これは、ヒストグラムを構築したうえで最良のポイントで分割するビンの数を示します。デフォルトは 20 です。
[ビンの数 (最上位レベル)] を入力します。
これは、ルートレベルで必要なビンの最小数を示します。デフォルトは 1024 です。
[ビンの数 (カテゴリ別)] を入力します。
これは、ヒストグラムを構築したうえで最良のポイントで分割するビンの最大数を示します。デフォルトは 1024 です。
[サンプルレート] をオンにし、各ツリーでサンプルとして使用される行の比率を入力します。0.0 ～ 1.0 の値を使用できます。
[各ツリーの列サンプルレート] をオンにし、各ツリーの列に対するサンプリング率を入力します。
0.0 ～ 1.0 の値を使用できます。
[各レベルの列数] をオンにし、すべてのレベルでの列のサンプリングに対する相対変化量を入力します。
このオプションはデフォルトで 1.0 に設定されており、0.0 ～ 2.0 の値を使用できます。
モデル予測 (スコア) を表す列を入力データに追加するには、[入力データを記録] をオンにします。
入力データがトレーニングおよびテストのデータサンプルにランダムに分割される場合は、1 ～ 100 の値を [トレーニングデータの比率] に指定します。
ステップ 11 で指定した値を 100 から引いた値を [テストデータの比率] に入力します。
[テストデータ用シード] により、データフローを何度実行してもデータが必ず同じ方法でテストデータとトレーニングデータに分割されるようになります。フローを実行するたびにランダムな分割を行う場合は、このフィールドをオフにします。
[OK] をクリックして、モデルと設定を保存するか、次のタブで操作を続行します。