Introducción

Big Data Quality SDK lo ayuda a crear, configurar y ejecutar trabajos MapReduce Trabajos Spark y funciones de Hive definidas por el usuario para operaciones de Data Quality en una plataforma Hadoop Hadoop.

Con el uso de SDK, puede crear y ejecutar trabajos directamente en una plataforma Hadoop, de este modo, se eliminan retrasos en la red y se ejecutan los procesos de Data Quality distribuidos en el clúster, lo que provoca una mejora sustancial en el rendimiento.

Los módulos compatibles con Big Data Quality SDK son:
  1. Módulo Advanced Matching
  2. Módulo Data Normalization
  3. Módulo Universal Name
  4. Módulo Universal Addressing

Uso de SDK

Este SDK actualmente se puede utilizar a través de:
  1. API de Java: admite MapReduce y Spark
  2. Funciones de Hive definidas por el usuario