我有一个IP地址列表。我需要为每个IP分配一个国家/地区。 例如http://www.ip2nation.com/提供此服务。 我找到了一些IP2Country的数据库,但是如何将它与猪一起整合?
输入:
14.59.63.28
145.89.87.211
54.27.253.89
98.201.50.22
116.48.29.143
145.89.87.211
20.109.204.65
20.109.204.65
预期产出:
14.59.63.28 country1
145.89.87.211 country2
54.27.253.89 country3
98.201.50.22 country4
116.48.29.143 country5
145.89.87.211 country2
20.109.204.65 country6
20.109.204.65 country6
答案 0 :(得分:0)
您需要从该数据库中获取IP数据库和国家/地区名称。 然后使用提取的数据与您流式传输的数据进行连接。
我会直接加入。为了获得更好的性能,您可以检查Pig中的复制连接 http://pig.apache.org/docs/r0.7.0/piglatin_ref1.html#Replicated+Joins