MapReduce内部加入?

时间:2013-04-25 04:52:08

标签: hadoop mapreduce

我想加入GeoIP数据库的日志条目。这就是我所拥有的。

  1. 在我的日志文件中,我将IP地址(外键)作为密钥提取。休息作为一个值。

  2. 在GeoIP数据库中,我有一系列IP地图到特定国家(IPFROM,IPTO,国家)。

  3. 现在我不确定如何加入这两个字段并加入使用。

1 个答案:

答案 0 :(得分:1)

如果我理解正确,您希望获取日志文件中给定IP地址的国家/地区名称。

您可以通过导出数据库表来创建一些csv。

然后您可以使用分布式缓存概念来读取该文件