标签: hadoop mapreduce
我想加入GeoIP数据库的日志条目。这就是我所拥有的。
在我的日志文件中,我将IP地址(外键)作为密钥提取。休息作为一个值。
在GeoIP数据库中,我有一系列IP地图到特定国家(IPFROM,IPTO,国家)。
现在我不确定如何加入这两个字段并加入使用。
答案 0 :(得分:1)
如果我理解正确,您希望获取日志文件中给定IP地址的国家/地区名称。
您可以通过导出数据库表来创建一些csv。
然后您可以使用分布式缓存概念来读取该文件