输入:来自多个服务器的带有Ngnix日志(毫秒级别)的Apache Kafka,日志通常按时间排序,但不完全是。
继续:什么工具或技术。我应该选择???
输出:格式为文本:URL时间(分钟级别)计数
e.g。
输入:2015-06-24 12:23:34.001 / rest / login?user = xxx HTTP / 1.0 ...
输出:/ rest / login" 2015-06-24 12:23" 2
非常感谢您的回复
顺便说一句。解析日志不是问题,而是如何进行聚合和计数。