需要省略猪

时间:2016-05-12 09:42:34

标签: hadoop apache-pig

我正在尝试解决以下问题,请建议

我有两个表想要删除表2中唯一匹配的记录。 注意:即使表2中有公共密钥,如果表2有1条记录,那么它应该只有 删除包含相同密钥的表1的1条记录, INPUT:

Table 1:
1,Sam,5000
1,Sam,5000
1,Sam,5000
2,Boo,3000

Table 2:
1,Sam,5000
2,Boo,3000

OUTPUT:
1,Sam,5000
1,Sam,5000

1 个答案:

答案 0 :(得分:1)

您需要获得两个关系之间的设置差异。 来源:See here。您必须从here下载支持函数的jar文件。该jar分发在Apache License

user5