PIG内连接使用不同的键

时间:2016-08-08 00:18:53

标签: hadoop mapreduce hive apache-pig hcatalog

a = LOAD '601' using org.apache.hive.hcatalog.pig.HCatLoader();

b = LOAD '602' using org.apache.hive.hcatalog.pig.HCatLoader(); 

c = LOAD '603' using org.apache.hive.hcatalog.pig.HCatLoader(); 

d = LOAD 'SKL' using org.apache.hive.hcatalog.pig.HCatLoader(); 

e = join a by (d_key, c_cd ), b by (d_key, c_cd), c by (p1_key, c_cd), d by    (p2_key, c_cd); 

Dump e;

=============================================== =========================

如果我在Hive中进行相同的连接,我会得到输出。但是在Pig中,在转储e时,它运行MapReduce,读取行但成功后不写入输出。 但是如果我通过嵌套的内连接在hive中做同样的事情,我会得到正确的输出。

任何人都可以向我解释PIG中的错误加入关系中的不同键吗?

如果我想将HCatlogue(HCatStore)加载到带有动态分区(没有值)的分区空白表中,那么另一件事。我收到分区表错误。我不知道Hcatalogue中出错的原因。 如果您遇到同样的事情并为我提供任何解决方案,请解释我。

0 个答案:

没有答案