Interflow Match

Interflow Match は、2 つの入力レコード ストリーム内の類似するデータ レコード間でマッチを検出します。最初のレコード ストリームはサスペクト レコードのソースで、2 番目のストリームは候補レコードのソースです。

Interflow Match では、マッチ グループ条件 (マッチ キー等) を使用して、特定のサスペクト レコードと重複する可能性があるレコードのグループを識別します。

レポート

Interflow Match ジョブを使用して、ジョブの結果を監視することができます。使用可能なカウンタは次の通りです:
DUPLICATE_COLLECTIONS
コレクション番号によってグループ化されたサスペクトレコードとその重複レコードで構成される、重複コレクションの数。
EXPRESS_MATCHES
1 つのコレクションで作成された Express マッチの数。

Express マッチは、サスペクトと候補が指定されたフィールド内の内容に正確にマッチした場合に作成され、通常は ExpressMatchKey が Match Key Generator によって提供されます。Express マッチが作成された場合、サスペクトと候補の重複を判定するためのそれ以上の処理は行われません。

AVERAGE_SCORE
すべての重複の平均マッチ スコア。

有効な値は 0 ~ 100 です。0 は精度の低いマッチを意味し、100 は完全一致を意味します。

INPUT_SUSPECTS
マッチャーが他のレコードとの照合を試みた入力ストリーム内のレコードの数。
SUSPECTS_WITH_DUPLICATES
少なくとも 1 つの候補レコードと一致した入力サスペクトの数。
UNIQUE_SUSPECTS
どの候補レコードとも一致しなかった入力サスペクトの数。
SUSPECTS_WITH_CANDIDATES
マッチ グループ内に候補レコードが少なくとも 1 つある、つまり照合の試みが少なくとも 1 回は行われた入力サスペクトの数。
SUSPECTS_WITHOUT_CANDIDATES
マッチ グループ内に候補レコードがない、つまり照合の試みが行われなかった入力サスペクトの数。
TOTAL_DUPLICATE_CANDIDATES
検出された重複候補の総数。
TOTAL_DUPLICATE_SCORE
すべての重複の合計マッチ スコア。