Intraflow Match

Intraflow Match は、単一の入力ストリーム内の類似するデータ レコード間でマッチを検出します。データフローの他のステージで定義または作成されたフィールドに基づいて階層型のルールを作成できます。

レポート

Intraflow Match ジョブを使用して、ジョブの結果を監視することができます。使用可能なカウンタは次の通りです:
INPUT_RECORDS
マッチング ソート実行前のマッチング ステージにおけるレコードの数。
DUPLICATE_RECORDS
マッチ グループ内の重複レコード (サスペクト レコードまたは候補レコード) の数。
UNIQUE_RECORDS
各マッチ グループで他のレコードにマッチしないサスペクトまたは候補レコードの数。

マッチ グループ内に 1 つしか存在していないレコードであれば、サスペクトは自動的にユニーク レコードとなります。

MATCH_GROUPS
(グループ化) マッチ キーでグループ化されたレコード。
DUPLICATE_COLLECTIONS
コレクション番号によってグループ化されたサスペクトレコードとその重複レコードで構成される、重複コレクションの数。
EXPRESS_MATCHES
1 つのコレクションで作成された Express マッチの数。

Express マッチは、サスペクトと候補が指定されたフィールド内の内容に正確にマッチした場合に作成され、通常は ExpressMatchKey が Match Key Generator によって提供されます。Express マッチが作成された場合、サスペクトと候補の重複を判定するためのそれ以上の処理は行われません。

AVERAGE_SCORE
すべての重複の平均マッチ スコア。

有効な値は 0 ~ 100 です。0 は精度の低いマッチを意味し、100 は完全一致を意味します。

TOTAL_DUPLICATES
検出された重複の総数。
TOTAL_SCORE
すべての重複の合計マッチ スコア。