标签: hadoop apache-pig
我正在尝试解决以下问题,请建议
我有两个表想要删除表2中唯一匹配的记录。 注意:即使表2中有公共密钥,如果表2有1条记录,那么它应该只有 删除包含相同密钥的表1的1条记录, INPUT:
Table 1: 1,Sam,5000 1,Sam,5000 1,Sam,5000 2,Boo,3000 Table 2: 1,Sam,5000 2,Boo,3000 OUTPUT: 1,Sam,5000 1,Sam,5000
答案 0 :(得分:1)
您需要获得两个关系之间的设置差异。 来源:See here。您必须从here下载支持函数的jar文件。该jar分发在Apache License下
user5