python:带有现有mapper的reducer

时间:2014-10-17 07:06:11

标签: python mapreduce

现在,我的mapper正常工作。我希望能够编写一个reducer ,从中获取我的链接,主机输出并生成一个唯一的列表,所以我猜这个映射器中的键组合在哪里?

for line in sys.stdin:
        line = line.strip()
        result = re.findall(r'<a href="(.*?)"', line)

        for word in result:
                print word + "\t" + Host #host is defined earlier as the first line of stdi

任何帮助将不胜感激。谢谢。

0 个答案:

没有答案