Hadoop Pig ausführen
Run Hadoop Pig führt ein Apache Pig-Skript aus. Apache Pig ist eine Sprache auf hoher Ebene zum Ausdrücken von Datenanalyseprogrammen und verfügt über die Infrastruktur zum Auswerten dieser Programme. Pig-Programme können parallelisiert werden. Dadurch können in diesen Programmen sehr umfangreiche Datensets verarbeitet werden.
Mit Run Hadoop Pig können Sie die Pig-Vorgänge auswählen, alle notwendigen Parameter eingeben und Ihr Pig-Skript automatisch vom System generieren lassen. Sie können das Pig-Skript auf einem beliebigen Hadoop-Server ausführen.
Run Hadoop Pig kann nur auf Hadoop-Dateiservern ausgeführt werden. Apache Hadoop 1.x und 2.x werden unterstützt.
Gehen Sie wie folgt vor, um die Optionen für Run Hadoop Pig festzulegen: