在Java中执行PigServer时出错

时间:2016-09-19 13:39:30

标签: java hadoop apache-pig bigdata

我正试图从我的java机器远程运行猪脚本,因为我写了下面的代码

import java.io.IOException;
import java.util.Properties;
import org.apache.pig.ExecType;
import org.apache.pig.PigServer;
import org.apache.pig.backend.executionengine.ExecException;

public class Javapig{ 
public static void main(String[] args) {
try {
    Properties props = new Properties();
    props.setProperty("fs.default.name", "hdfs://hdfs://192.168.x.xxx:8022");
    props.setProperty("mapred.job.tracker", "192.168.x.xxx:8021");

    PigServer pigServer = new PigServer(ExecType.MAPREDUCE, props);
    runIdQuery(pigServer, "fact");
    }
    catch(Exception e) {
        System.out.println(e);
    }
 }
public static void runIdQuery(PigServer pigServer, String inputFile) throws IOException {
    pigServer.registerQuery("A = load '" + inputFile + "' using org.apache.hive.hcatalog.pig.HCatLoader();");
    pigServer.registerQuery("B = FILTER A by category == 'Aller';");
    pigServer.registerQuery("DUMP B;");
    System.out.println("Done");
 }
}

但在执行时我遇到错误。

错误

ERROR 4010: Cannot find hadoop configurations in classpath (neither hadoop-site.xml nor core-site.xml was found in the classpath).

我不知道自己做错了什么。

1 个答案:

答案 0 :(得分:1)

好吧,自我描述错误......

  

在类路径中找不到hadoop-site.xml和core-site.xml

您需要在应用程序的类路径中使用这两个文件。

理想情况下,您可以从$HADOOP_CONF_DIR文件夹中获取这些内容,并将它们复制到Java src/main/resources中,假设您具有Maven结构

此外,对于这些文件,您应该使用Hadoop的Configuration对象

PigServer(ExecType execType, org.apache.hadoop.conf.Configuration conf)