标签: python apache-pig
我有一个'输入'文件。输入中有大约600个电子邮件地址。我需要获取这600个电子邮件地址,并查看数据集中是否存在任何匹配项。如何加载这600个电子邮件地址作为猪脚本的输入。我可以使用python执行此操作吗?
答案 0 :(得分:1)
你有没有看过replicated joins?