请帮助我找到地图并减少以下问题的功能。
我有多个包含IP地址和错误代码的日志文件。我想要输出IP地址,错误代码以及如何为该IP地址显示错误代码的时间。我只想要键值对而不是代码。
请给我:地图输入“键,值”并输出“键,值”和减少输入“键,值”并输出“键,值”。
我现在正在输入“logfile,textline”并输出“ipadress,numberOffErrorCodes”,“numberOffErrorCodes,errorCode”。
但我不知道我该如何继续。
提前致谢。
答案 0 :(得分:0)
你有几个选择。一种是使用身份映射器。这将收集reducer中给定IP地址的所有错误代码。然后,您将创建一个错误代码映射到计数(例如map),然后reducer可以为映射中的每个代码发出一行。
另一种选择是从IP地址和错误代码创建密钥。例如,123.44.55.66:18(18是错误代码)。然后减速器可以剥离':NN',你可以简单地计算条目的数量。