可以使用Lucene来存储连续的数据流,并充当Google Analytics的数据存储区。

时间:2015-03-09 09:32:05

标签: solr elasticsearch lucene cassandra analytics

可以将Apache lucene用作数据库,我的意思是说,我已经执行过POC并且已经看到它可以非常快速地索引数据并且在Lucene中搜索也非常快。

假设,我的问题陈述是:我有一个连续的传入数据流,我想将其存储在数据存储区中,并从该存储区查询以获得实时分析。我所做的是我提供数据并创建lucene索引缓冲数据(缓冲数据间隔为2-5秒),然后使用该索引对数据执行读操作。

如果依旧对数据进行索引,Lucene是否可以正常运行,比如现有数据每秒5 MB(每天69 GB),并同时对索引数据执行读取操作。 我正在尝试使用cassandra来测试这种情况,但我知道Lucene具有良好的搜索速度和索引数据的速度非常快......因为。因此,我可以将其用作数据库来进行流量控制,然后查询流量以获取报告数据。???

请告诉我可用的替代技术,如果有的话,在市场上。 (最好是开源)

提前致谢.. cheerss。!!!

0 个答案:

没有答案