我正在测试Solr作为我的全文搜索引擎提供商超过1,000,000个文档。 我还有用户信息数据,这些数据与作为创建者的文档相关,我想存储用户点击。
是否需要使用数据库引擎来存储所有数据?或者Solr稳定且安全可靠? 在Solr中是否存在丢失存储数据的风险(我知道它可能发生在Solr索引上,我可以重建它,但RAW数据怎么样?)
我想拥有第二个存储空间的唯一原因是我的所有数据都有另一个备份/版本(不是用于查询,...)。
答案 0 :(得分:1)
阿米尔,
Solr稳定。如果您不相信,请查看此处的用户列表... http://wiki.apache.org/solr/PublicServers包括NASA,AT& T等......
Solr的主要目标是充当搜索引擎,帮助我们实现搜索,NLP算法,大数据问题等。 Solr并不是主要的数据存储(也可能是一个......
上面含糊不清的句子的原因是,与关系数据库不同,Solr可以存储原始数据和索引OR INDEX ONLY而不包含数据本身。
如果只存储索引,通过在每个字段的Solr schema.xml Stored =“false”中指定,那么您将获得更小的Solr数据量和更好的性能,但是当您查询Solr时,您将只收到文档ID,您将不得不继续使用您的关系数据库.... 当然,您可以存储一些数据,一些文档字段,并避免存储一些。
当然,您应该备份/复制Solr以确保灾难恢复等。