我正在探索接收和持续大量请求(并发和跨多个服务器)的方法,并且我对于查看存储传入数据包的最快可靠方法的观点感兴趣供以后处理。 我已将其缩小到这些选项范围,但我确信这是一个我没想过的创造性解决方案:
由于
答案 0 :(得分:2)
我正在使用Fluentd将小包数据(请求日志)转储到中央日志链接(s3)。 这具有服务器上的低延迟和将所有数据放在中心位置的优点。从那里你可以使用你的hadoop集群来处理它们。
它用作输入((sys)日志,http套接字,直接代码集成)及其输出(s3,文件,(no)sqldb,scribe等)也非常灵活。
至于你的选择,我的发现是:
您还可以查看有关中央记录的blogpost。