モデルのプロパティの定義

  1. [プライマリ ステージ] > [展開済みステージ] > [Machine Learning] にある [Random Forest Classification] ステージをクリックしてキャンバス上にドラッグします。さらに、そのステージを、データフロー内の該当位置に配置して、他のステージに接続します。
    注: 入力ステージは、モデルの目標フィールドと入力変数フィールドの両方を含むデータ ソースでなければなりません。出力ステージは、[基本オプション] タブで [入力データを記録] オプションを選択しない限り不要です。Machine Learning モデル管理ツールとは独立して出力を取得する場合は、出力ステージを接続することもできます。
  2. [Random Forest Classification] ステージをダブルクリックして、[Random Forest Classification オプション] ダイアログ ボックスを表示します。
  3. デフォルトのモデル名を使用しない場合は、[モデル名] を入力します。
  4. オプション: [上書き] チェックボックスをオンにして、既存モデルを新しいデータで上書きします。
  5. [目標フィールド] ドロップダウンをクリックし、数値フィールドを選択します。
  6. [多項レベル] をクリックし、目標フィールドをグループ化して分けることができるカテゴリの最大数を入力します。このオプションをオンにすると、[基本オプション] タブの [入力データを記録] オプションが無効になることに注意してください。
  7. オプション: モデルの [説明] を入力します。
  8. モデルにデータを追加するフィールドの [含める] をクリックします。
    目標フィールドとして選択したフィールドは必ず含めてください。
  9. [モデル データ タイプ] ドロップダウンを使用して、各入力フィールドを数値、カテゴリ値、日付と時刻のいずれのフィールドとして使うかを指定します。
  10. [OK] をクリックして、モデルと設定を保存するか、次のタブで操作を続行します。