在Pig中,查找表中条目的补充

时间:2012-08-27 17:51:37

标签: database apache-pig

我有一个表A,其中包含一个列表,一个表B,其中包含A中项目的子列表。如何获得一个表C,其中包含BA的补充列表?

我知道如何在sql中执行此操作。我不确定如何在Pig中接近它。

感谢。

1 个答案:

答案 0 :(得分:2)

在PIG中,你有两个“包”A和B,其中B是A的子集。

如果B仅包含A中的值,则可以执行C = DIFF(A,B)。 但是,请考虑DIFF删除重复项,因此您将获得A中B的补充减少到唯一值。

通常,DIFF提供A中B的补充和B中A的补充。