Transactional Match

Transactional Match は、重複を特定するため、サスペクト レコードと、あるグループのレコードを照合します。これらのレコードはまず、選択した列によりグループ化され、最初のレコードがサスペクト レコードとしてマークされます。グループの残りすべてのレコードは候補レコードと呼ばれ、サスペクト レコードと照合されます。

候補レコードが重複の場合は、コレクション番号が割り当てられ、そのマッチ レコード タイプに重複が設定され、その候補レコードが書き出されます。グループ内のマッチしない候補にはコレクション番号 0 が割り当てられ、そのラベルにユニークが設定され、その候補が書き出されます。

レポート

Transactional Match ジョブを使用して、ジョブの結果を監視することができます。使用可能なカウンタは次の通りです:
AVERAGE_SCORE
すべての重複の平均マッチ スコア。

有効な値は 0 ~ 100 です。0 は精度の低いマッチを意味し、100 は完全一致を意味します。

INPUT_SUSPECTS
マッチャーが他のレコードとの照合を試みた入力ストリーム内のレコードの数。
SUSPECTS_WITH_DUPLICATES
少なくとも 1 つの候補レコードと一致した入力サスペクトの数。
UNIQUE_SUSPECTS
どの候補レコードとも一致しなかった入力サスペクトの数。
SUSPECTS_WITH_CANDIDATES
マッチ グループ内に候補レコードが少なくとも 1 つある、つまり照合の試みが少なくとも 1 回は行われた入力サスペクトの数。
SUSPECTS_WITHOUT_CANDIDATES
マッチ グループ内に候補レコードがない、つまり照合の試みが行われなかった入力サスペクトの数。
TOTAL_DUPLICATES_SCORE
すべての重複の合計マッチ スコア。
TOTAL_DUPLICATES
検出された重複の総数。