Opérations Hadoop Pig
Les différentes opérations Pig sont les suivantes :
- Tri : trie les données dans l'ordre alphabétique. L'opération de tri est décrite en détail à la section Tri des enregistrements d'entrée.
- Filtre : vous permet de filtrer les données selon vos besoins. L'opération de filtre est décrite en détail à la section Filtrage des enregistrements d'entrée.
- Agrégat : vous permet d'effectuer des opérations statistiques comme Somme, Compte et autres, sur les données.
Sélectionnez les opérations d'agrégation pour chaque champ de votre choix.
- Somme : calcule la somme des valeurs dans le champ.
- Moyenne : calcule la moyenne de toutes les valeurs dans le champ.
- Maxi. : calcule la valeur maximale des valeurs dans le champ.
- Mini. : calcule la valeur minimale des valeurs dans le champ.
- Compte : calcule le nombre total de valeurs dans le champ. Remarque : Si vous sélectionnez l'opération Distinct, seules les valeurs uniques sont comptées.
- Distinct : si vous sélectionnez cette option, l'opération Compte Agrégat compte uniquement les valeurs uniques dans le champ.
- Limite : saisissez une valeur supérieure à zéro pour limiter le nombre d'enregistrements traités à cette valeur.