ジオコーディングの最適化
ジオコーディング ステージでは、入力レコードが郵便番号でソートされている場合に最大のパフォーマンスが得られます。これは、参照データが郵便番号でソートされてメモリ内にロードされているためです。入力がソートされていると、ソートされていない入力に比べ、実行速度が数倍速くなることもあります。郵便番号フィールドにデータが入っていないレコードもあるため、次のソート順を推奨します。
- PostalCode
- StateProvince
- City
異なるマッチ モードを試してみることによっても、ジオコーディング ステージを最適化できます。マッチ モードは、ジオコーディング結果が近似一致であるかどうかを、ジオコーディング ステージが判定する方法を制御します。マッチ モードを 緩和 に設定して、要件を満たす結果が得られるかどうか確認してみてください。一般的に 緩和 モードは、他のマッチ モードよりもパフォーマンスが向上します。
Geocode US Address の最適化
Geocode US Address ステージには、パフォーマンスに影響を与える複数のオプションがあります。以下のオプションがこのファイル内にあります。
SpectrumLocation\server\modules\geostan\java.properties
- egm.us.multimatch.max.records
- 返されるマッチの最大数を指定します。この数値を小さくするとパフォーマンスは向上しますが、マッチ数は少なくなります。
- egm.us.multimatch.max.processing
- 実行する検索の数を指定します。この数値を小さくするとパフォーマンスは向上しますが、マッチ数は少なくなります。
- FileMemoryLimit
- 最初にメモリにロードする参照データの量を制御します。