デフォルトのソート パフォーマンス オプションの設定

大きなデータ セットのソートは、バッチ処理中に実行される操作のうちで最も時間がかかるものの 1 つになることがあります。そのため、適切なソート パフォーマンス オプションの設定は、ジョブのパフォーマンスに大きな影響を与える可能性があります。ソート パフォーマンス オプションによってメモリとディスクの使用率を制御すると、使用可能なメモリとディスクの容量を十分に活用できます。

ソート パフォーマンスの設定は、2 つの場所で行うことができます。1 つは Management Console です。ここでは、システムで使用されるデフォルトのソート パフォーマンス オプションを指定できます。もう 1 つは、ソートを実行するデータフロー ステージです。Sorter、Read from File、Write to File をはじめ、ソート オプションを含むその他すべてのステージには、ソート パフォーマンス オプションが含まれています。ソート パフォーマンス オプションをステージ内で指定する際には、デフォルトのソート パフォーマンス オプションをオーバーライドすることで、データフロー内の個々のステージに異なる設定を選択して適用できます。

ここでは、Spectrum™ Technology Platform サーバー上で実行されるジョブ用のデフォルトのソート パフォーマンス オプションの設定方法を示します。

  1. Management Console を開きます。
  2. [フロー] > [デフォルト] を選択します。
  3. 以下の設定によって、ソート パフォーマンスを制御します。
    メモリ内レコードの上限値
    ソートでメモリ内に保持できるデータ行の最大数を指定します。この上限を越えると、ディスクにページングします。デフォルトでは、10,000 レコード未満のソートはメモリ内で行われ、10,000 レコードを越えるソートはディスク ソートとして実行されます。上限値は 100,000 レコードです。通常、メモリ内ソートはディスク ソートよりはるかに速いため、大部分のソートがメモリ内ソートとなり、大規模セットのみがディスクに書き出されるよう、この値を十分大きく設定してください。
    注: 複数のジョブを同時並行で実行する環境では、[メモリ内レコードの上限値] の設定を増やすと、メモリ不足になる可能性が高くなります。
    一時ファイルの最大数
    ソート プロセスで使用できる一時ファイルの最大数を指定します。使用する一時ファイルの数を増やすと、パフォーマンスが向上する可能性があります。ただし、最適なファイル数は Spectrum™ Technology Platform を実行しているサーバーの構成に大きく依存します。さまざまな設定を試して、使用する一時ファイル数の増減がパフォーマンスに与える影響を確認する必要があります。必要になる可能性がある一時ファイルの適切な数を計算するには、次の式を使用します。
    (NumberOfRecords × 2) ÷ InMemoryRecordLimit = NumberOfTempFiles 
    一時ファイルの最大数は 1,000 を超える値にはできないことに注意してください。
    圧縮を有効にする
    一時ファイルをディスクに書き込むときに圧縮します。
    注: 最適なソート パフォーマンスの設定は、サーバーのハードウェア構成によって異なります。それでも一般には、次の式で妥当なソート パフォーマンスが得られます。
    (InMemoryRecordLimit × MaxNumberOfTempFiles ÷ 2) >= TotalNumberOfRecords