根据我的知识,我们可以使用pig用于Mapreduce.And也可以使用它。你能解释一下我在哪种情况下使用它?
答案 0 :(得分:3)
如果您可以在Pig(或Hive)中执行此操作,请在Pig(或Hive)中执行此操作。
否则,请在Java MapReduce中执行此操作。
猪的好处:
有些事情你可能认为你最初不能在Pig中做,并且想要使用Java,但是一旦你了解了它,你就可以在Pig中做到这一点:
map
and bag
datatypes可以很好地建模分层数据结构,但您可能需要编写大量的UDF。这里有一些,但你明白了。 Pig是非常可定制的,一般来说,你最终会编写更少的Java。
基本的东西很容易。我们可以通过一些努力来完成分层数据结构和自定义加载等操作。好的,那还剩下什么?
JOIN
and USING 'replicated'
)希望其他人可以在评论中添加他们在Pig中无法做的事情。