我的网站存储数百万个实体。访问者通过键入仅包含在标题中的单词来搜索实体。标题最多100个字符。
这不是经典文档搜索的情况,用户在大型blob中搜索。 这些领域很短。此外,这里的主要问题是性能(而不是相关性),因为实体是“在您键入时”(自动建议)提供的。
什么是更聪明的路线?
另外,如果我想在将来介绍拼写建议,这将如何影响我。
谢谢!
答案 0 :(得分:0)
仅限数据库解决方案的专家:
Solr解决方案的专家:
您可能还想考虑未来的要求(如果您的文档最终不仅仅包含标题字段并且您想要指定某种相关性,该怎么办?如果您决定允许人们搜索这些实体的正文,该怎么办?和/或你想索引其他文档类型如MS Word?如果你想要分析搜索结果怎么办?Solr擅长所有这些)。
我不确定您是否需要为数据库中的每个单词创建一个条目,而不仅仅是'%[query_word]%'搜索,如果您打算用每个单词创建记录。由于要求看起来非常简单,因此可以更简单地使用数据库作为初学者。扩展数据库性能应该相当容易。
我可以告诉你我们在网站上使用Solr并且我们喜欢它的性能,我们使用它来进行非常简单的查找。但是,我们缺少的一件事是将Solr数据与数据库数据相结合的方法。还有额外的维护。在一天结束时,没有一个简单的答案。