我需要每天分析千兆字节的日志文件。我正在尝试确定要使用的正确的nosql DB。以下是日志文件特征和所需分析的概述:
我从LogStash开始,但我必须为每种请求和响应指定架构才能查询。如果供应商更改响应或添加新供应商,该怎么办? Logstash似乎适用于固定格式的日志,如apache服务器日志。
MongoDB看起来不是很有用,因为聚合的性能对其他用户的博客来说并不是很令人印象深刻。在mongoDB中,我需要使用数组值来爆炸字段,以便能够查询这些数组中的值。这将显着增加数据库大小。
有人还有其他想法吗?