Opérations Hadoop Pig

Les différentes opérations Pig sont les suivantes :

  1. Tri : trie les données dans l'ordre alphabétique. L'opération de tri est décrite en détail à la section Tri des enregistrements d'entrée.
  2. Filtre : vous permet de filtrer les données selon vos besoins. L'opération de filtre est décrite en détail à la section Filtrage des enregistrements d'entrée.
  3. Agrégat : vous permet d'effectuer des opérations statistiques comme Somme, Compte et autres, sur les données.

    Sélectionnez les opérations d'agrégation pour chaque champ de votre choix.

    • Somme : calcule la somme des valeurs dans le champ.
    • Moyenne : calcule la moyenne de toutes les valeurs dans le champ.
    • Maxi. : calcule la valeur maximale des valeurs dans le champ.
    • Mini. : calcule la valeur minimale des valeurs dans le champ.
    • Compte : calcule le nombre total de valeurs dans le champ.
      Remarque : Si vous sélectionnez l'opération Distinct, seules les valeurs uniques sont comptées.
  4. Distinct : si vous sélectionnez cette option, l'opération Compte Agrégat compte uniquement les valeurs uniques dans le champ.
  5. Limite : saisissez une valeur supérieure à zéro pour limiter le nombre d'enregistrements traités à cette valeur.