ジオコーディングの最適化

ジオコーディング ステージでは、入力レコードが郵便番号でソートされている場合に最大のパフォーマンスが得られます。これは、参照データが郵便番号でソートされてメモリ内にロードされているためです。入力がソートされていると、ソートされていない入力に比べ、実行速度が数倍速くなることもあります。郵便番号フィールドにデータが入っていないレコードもあるため、次のソート順を推奨します。

  1. PostalCode
  2. StateProvince
  3. City

異なるマッチ モードを試してみることによっても、ジオコーディング ステージを最適化できます。マッチ モードは、ジオコーディング結果が近似一致であるかどうかを、ジオコーディング ステージが判定する方法を制御します。マッチ モードを 緩和 に設定して、要件を満たす結果が得られるかどうか確認してみてください。一般的に 緩和 モードは、他のマッチ モードよりもパフォーマンスが向上します。

Geocode US Address の最適化

Geocode US Address ステージには、パフォーマンスに影響を与える複数のオプションがあります。以下のオプションがこのファイル内にあります。

SpectrumLocation\server\modules\geostan\java.properties

egm.us.multimatch.max.records
返されるマッチの最大数を指定します。この数値を小さくするとパフォーマンスは向上しますが、マッチ数は少なくなります。
egm.us.multimatch.max.processing
実行する検索の数を指定します。この数値を小さくするとパフォーマンスは向上しますが、マッチ数は少なくなります。
FileMemoryLimit
最初にメモリにロードする参照データの量を制御します。