オプション
-
[ロードするマッチ ルール] フィールドで、定義済みのいずれかのマッチ ルールを選択します。このマッチ ルールはそのまま使用することも、必要に応じて変更することもできます。 定義済みのいずれかのマッチ ルールを出発点として使用せずに、新しいマッチ ルールを作成する場合は、[新規作成] をクリックします。 カスタム ルールは、データフローで 1 つだけ使用できます。
注: Enterprise Designer の [データフロー オプション] 機能を使用すると、マッチ ルールを実行時に公開して設定できます。
- マッチ キュー内のレコードをグループ化するのに使用するフィールドを選択するには、[グループ化方法] をクリックします。 Intraflow Match は、同じマッチ キューにある他のレコードに対してのみレコードのマッチングを試みます。
- [グループ化方法] フィールドで選択したフィールドに基づいて、照合前に入力をソートするには、[ソート] ボックスを選択します。
-
ソート パフォーマンス オプションを追加で指定するには、[詳細設定] をクリックします。
- メモリ内レコードの上限値
- ソートでメモリ内に保持できるデータ行の最大数を指定します。この上限を越えると、ディスクにページングします。デフォルトでは、10,000 レコード未満のソートはメモリ内で行われ、10,000 レコードを越えるソートはディスク ソートとして実行されます。上限値は 100,000 レコードです。通常、メモリ内ソートはディスク ソートよりはるかに速いため、大部分のソートがメモリ内ソートとなり、大規模セットのみがディスクに書き出されるよう、この値を十分大きく設定してください。注: 複数のジョブを同時並行で実行する環境では、[メモリ内レコードの上限値] の設定を増やすと、メモリ不足になる可能性が高くなります。
- 一時ファイルの最大数
- ソート プロセスで使用できる一時ファイルの最大数を指定します。使用する一時ファイルの数を増やすと、パフォーマンスが向上する可能性があります。ただし、最適なファイル数は Spectrum™ Technology Platform を実行しているサーバーの構成に大きく依存します。さまざまな設定を試して、使用する一時ファイル数の増減がパフォーマンスに与える影響を確認する必要があります。必要になる可能性がある一時ファイルの適切な数を計算するには、次の式を使用します。
一時ファイルの最大数は 1,000 を超える値にはできないことに注意してください。(NumberOfRecords × 2) ÷ InMemoryRecordLimit = NumberOfTempFiles
- 圧縮を有効にする
- 一時ファイルをディスクに書き込むときに圧縮します。
注: 最適なソート パフォーマンスの設定は、サーバーのハードウェア構成によって異なります。それでも一般には、次の式で妥当なソート パフォーマンスが得られます。(InMemoryRecordLimit × MaxNumberOfTempFiles ÷ 2) >= TotalNumberOfRecords
-
[Express マッチ有効] をクリックして Express キー値の初期比較を実行し、2 つのレコードが一致すると判断できるかどうかを確認します。
Express キーは、MatchKeyGenerator で生成されるマッチ キーの一部として生成できます。 詳細については、Match Key Generatorを参照してください。
-
[最初のコレクション番号] テキスト ボックスに、重複レコードのコレクション番号フィールドに割り当てる最初の番号を入力します。
コレクション番号は、マッチ キュー内の各重複レコードを一意に識別するための値です。 ユニーク レコードには、コレクション番号 0 が割り当てられます。 各重複レコードには、[最初のコレクション番号] テキスト ボックスに指定された値で始まるコレクション番号が割り当てられます。
- [スライディング ウィンドウ] をクリックして、このマッチング方法を有効にします。 スライディング ウィンドウの詳細については、スライディング ウィンドウ マッチング方法 を参照してください。
- [分析用データを生成する] をクリックしてマッチ結果を生成します。 詳細については、マッチ結果の分析を参照してください。
-
[ユニーク レコードにコレクション番号 0 を割り当て] (デフォルトでオン) は、ユニーク レコードにコレクション番号としてゼロを割り当てます。 このオプションをオフにすると、ユニーク レコードにゼロ以外のコレクション番号が生成されます。 ユニーク レコードのコレクション番号は、他のコレクション番号と連動して順に生成されます。 例えば、マッチング データフローで 5 つのレコードが検出され、最初の 3 つのレコードがユニークの場合、コレクション番号は下の最初のグループに示すように割り当てられます。 マッチング データフローで 5 つのレコードが検出され、最後の 2 つがユニークの場合、コレクション番号は下の 2 つ目のグループに示すように割り当てられます。
オプション 説明 コレクション番号 レコード タイプ 1 ユニーク 2 ユニーク 3 ユニーク 4 重複/サスペクト 4 重複/サスペクト コレクション番号 レコード タイプ 1 重複/サスペクト 1 重複/サスペクト 2 ユニーク 3 ユニーク 4 ユニーク このボックスをオンのままにしておくと、データフローで検出されたユニーク レコードにデフォルトでゼロのコレクション番号が割り当てられます。 - 他のオプションの変更の詳細については、マッチ ルールの作成を参照してください。
- [評価] をクリックして、サスペクト レコードと候補レコードとの比較によるスコアを生成します。 詳細については、Interflow Matchを参照してください。