配置Solr架构的最佳实践

时间:2010-06-23 10:10:17

标签: schema solr document-database

我正在配置我的schema.xml文件,并试图找出设置文档的最佳方法。我使用RMDBS,因此许多对象是关系型的。

以此网站为例;文档通常由一个问题组成,后跟0个或多个答案。假设您要为此设置字段,您必须按照我看到的方式在同一文档中声明所有问题和答案字段。但鉴于答案可能不止一个,您必须为每个答案创建一个文档。这意味着每个问题和每个答案都存储在一个单独的文档中,其中包含两个字段。

我没有看到针对这类问题的不同方法,但是我对Solr和文档DB的相对较新,所以我可能错了。

简而言之:如果我实现这样的架构,最佳做法是什么?

1 个答案:

答案 0 :(得分:2)

另一种方法是为答案设置一个问题字段和一个多值字段,并将它们放在同一个文档中。这可能是最好的开始方式,除非您有特定要求支持每个答案文档的方法。

例如,如果您需要将单个答案作为独立搜索结果进行匹配,则可以使用每个答案文档方法获得更好的结果和性能,因为“答案”文档将被评分,排名和加载隔离。

但这将是对此类数据的非常规使用。通常,当您搜索堆栈溢出等网站时,您正在搜索涵盖特定主题的问题和答案集,因此在一个文档中包含所有内容更有意义。