标签: database apache-pig
我有一个表A,其中包含一个列表,一个表B,其中包含A中项目的子列表。如何获得一个表C,其中包含B中A的补充列表?
A
B
C
我知道如何在sql中执行此操作。我不确定如何在Pig中接近它。
感谢。
答案 0 :(得分:2)
在PIG中,你有两个“包”A和B,其中B是A的子集。
如果B仅包含A中的值,则可以执行C = DIFF(A,B)。 但是,请考虑DIFF删除重复项,因此您将获得A中B的补充减少到唯一值。
通常,DIFF提供A中B的补充和B中A的补充。