Introduction

SDK qualité des Big Data vous permet de créer, de configurer et d'exécuter des jobs MapReduce, des jobs Spark et des fonctions définies par l'utilisateur Hive pour des opérations Data Quality sur une plate-forme Hadoop.

Grâce au SDK, vous pouvez créer et exécuter des jobs directement sur une plate-forme Hadoop. Vous pouvez ainsi supprimer les délais réseau et exécuter les processus Data Quality distribués en cluster, ce qui a pour effet d'améliorer radicalement les performances.

Les modules pris en charge par SDK qualité des Big Data sont les suivants :

Module Advanced Matching
Module Data Normalization
Module Universal Name
Module Universal Addressing

SDK Usage

Ce SDK peut actuellement être utilisé via :

API Java : prennent en charge MapReduce et Spark
Fonctions Hive définies par l'utilisateur