现在,我的mapper正常工作。我希望能够编写一个reducer ,从中获取我的链接,主机输出并生成一个唯一的列表,所以我猜这个映射器中的键组合在哪里?
for line in sys.stdin:
line = line.strip()
result = re.findall(r'<a href="(.*?)"', line)
for word in result:
print word + "\t" + Host #host is defined earlier as the first line of stdi
任何帮助将不胜感激。谢谢。