Hadoop Pig ausführen
Die Aktivität „Hadoop Pig ausführen“ führt ein Apache Pig-Skript aus. Apache Pig ist eine Sprache auf hoher Ebene zum Ausdrücken von Datenanalyseprogrammen und verfügt über die Infrastruktur zum Auswerten dieser Programme. Pig-Programme können parallelisiert werden. Dadurch können in diesen Programmen sehr umfangreiche Datensets verarbeitet werden.
Mit „Hadoop Pig ausführen“ können Sie die Pig-Vorgänge auswählen, alle notwendigen Parameter eingeben und Ihr Pig-Skript automatisch vom System generieren lassen. Sie können das Pig-Skript auf einem beliebigen Hadoop-Server ausführen.
„Hadoop Pig ausführen“ kann nur auf Hadoop-Dateiservern ausgeführt werden. Apache Hadoop 1.x und 2.x werden unterstützt.
Gehen Sie wie folgt vor, um die Optionen für „Hadoop Pig ausführen“ festzulegen: