Validate Address MapReduce ジョブの使用

重要: 最初の Validate Address ジョブを作成および実行する前に、Acushare サービスが実行されていることを確認します。手順については、Acushare サービスの実行を参照してください。
  1. UAMAddressingFactoryのインスタンスを、その静的メソッド getInstance() を使用して作成します。
  2. UAMAddressingDetailを指定するProcessType のインスタンスを作成して、Validate Address ジョブの入力と出力の詳細を指定します。このインスタンスは、MRProcessTypeタイプを使用する必要があります。これを行うには、次の手順に従います。
    1. このジョブの入力設定を行うには、UniversalAddressValidateInputConfigurationのインスタンスを作成します。
      列挙体 列挙 PreferredCity列挙 CasingType列挙 CityNameFormat列挙 OutputCountryFormat列挙 StandardAddressFormat列挙 StandardAddressPMBLine列挙 StreetMatchingStrictness列挙 FirmMatchingStrictness列挙 DirectionalMatchingStrictness列挙 DualAddressLogic と該当する場合は 列挙 DPVSuccessStatusCondition を使用して、さまざまな必須フィールドの値を設定します。
      重要: Validate Address を CASS 認定™ モードで実行するには、このインスタンスのフィールド outputReport3553outputCASSDetail、および outputReportSummarytrue に設定します。CASS レポートにはジョブを CASS 認定™ モードで実行した場合にのみ有効なコンテンツが含められます。それ以外の場合は、空白のレポート PDF が生成されます。
    2. LocalReferenceDataPathのインスタンスを作成することによって、リファレンス データ パスの詳細を設定します。
    3. 各種ジョブ実行設定を行うために、上で作成した UAMUSAddressingEngineConfigurationインスタンスと、COBOL ランタイム パスおよびモジュール ディレクトリ パス (String 値) を引数としてコンストラクタに渡して、LocalReferenceDataPath のインスタンスを作成します。
      UAMUSAddressingEngineConfigurationインスタンスを作成した後、その各種必須フィールドの値を設定します。
    4. JVM 設定を構成するには、UniversalAddressGeneralConfigurationのインスタンスを作成します。
    5. UAMAddressingDetailのインスタンスを作成します。その際、JobConfig タイプのインスタンスと、上で作成した UAMUSAddressingEngineConfigurationUniversalAddressGeneralConfiguration、および UniversalAddressValidateInputConfiguration のインスタンスを引数としてコンストラクタに渡します。
      JobConfigパラメータは、MRJobConfig タイプのインスタンスである必要があります。
      1. inputPathインスタンスの UAMAddressingDetail フィールドを使用して、入力ファイルの詳細を設定します。

        テキスト入力ファイルの場合は、適切なコンストラクタを呼び出して、関連する詳細な入力ファイル情報を指定してFilePathのインスタンスを作成します。ORC 入力ファイルの場合、ORC 入力ファイルのパスを引数に指定して OrcFilePathのインスタンスを作成します。

      2. outputPathインスタンスの UAMAddressingDetail フィールドを使用して、出力ファイルの詳細を設定します。

        テキスト出力ファイルの場合は、適切なコンストラクタを呼び出して、関連する詳細な出力ファイル情報を指定してFilePathのインスタンスを作成します。ORC 出力ファイルの場合、ORC 出力ファイルのパスを引数に指定して OrcFilePathのインスタンスを作成します。

      3. jobNameインスタンスの UAMAddressingDetail フィールドを使用して、ジョブの名前を設定します。
      4. compressOutputインスタンスの UAMAddressingDetail フラグに true を設定して、ジョブの出力を圧縮します。
  3. 先ほど作成した UAMAddressingFactoryのインスタンスを使用してそのメソッドcreateJob() を呼び出し、MapReduce ジョブを作成します。ここで、上の UAMAddressingDetailのインスタンスを引数として渡します。
    createJob()メソッドは、List のインスタンスの ControlledJob を返します。
  4. JobControlのインスタンスを使用して、作成したジョブを実行します。
  5. ジョブの正常実行後にレポート カウンタを表示するには、先ほど作成した UAMAddressingFactoryのインスタンスを使用して、そのメソッド getCounters() を呼び出します。作成したジョブを引数として渡します。
    カウンタの Mapが返されます。
  6. ジョブの正常実行後に CASS レポートを生成するには、先ほど作成した UAMAddressingFactoryのインスタンスを使用してgenerateCASSReport() メソッドを呼び出します。多重定義されている generateCASSReport()メソッドのどのバージョンを呼び出しても構いません。
    使用される generateCASSReport()メソッド シグネチャによって、1 つ前の手順で得られたレポート カウンタの MapjobName、生成された CASS レポートを格納する path、作成する reportType を引数として渡します。
    pathは、SDK ジョブがクラスタ環境で実行している場合はクラスタ上、クライアント コンピュータ上で実行している場合はクライアント コンピュータ上の場所である必要があります。
    注: pathが指定されていない場合は、現在の作業ディレクトリに新しい CASS レポートが配置されます。

    reportTypeパラメータの値は、列挙 UAMCASSReportTypeに記載された値でなければなりません。1 つ以上のレポート タイプをこのパラメータに指定できます。