はじめに

Big Data Quality SDKでは、Hadoop プラットフォームでデータ品質の操作を行うために MapReduce ジョブ、 Spark ジョブおよび Hive ユーザ定義関数を作成、設定、および実行できます。

この SDK を使用すると、Hadoop プラットフォームで直接ジョブを作成および実行できるため、ネットワーク遅延をなくし、クラスタで分散されたデータ品質プロセスを実行することにより、パフォーマンスを大幅に向上させることが可能になります。

Big Data Quality SDKでは、次のモジュールがサポートされています。

SDK の使用

この SDK は現在、次を介して使用できます。