我拥有超过数百万份全文文档的SOLR索引。这非常有效。到目前为止,非常好。
用户可以在文件夹或集合中组织这些文档。我希望能够将搜索限制在某个文件夹(或多个文件夹),而无需为每个文件夹创建索引。不同的用途可以将文档存储在不同的文件夹中,它更像是一个标签而不是一个位置。
我计划通过为存储文档的文件夹(或集合)ID添加多值字段来执行此操作。
这是使用SOLR的'有效'方式还是我遗漏了什么?另外,我是否会遇到有关多值字段中项目数量的限制?此外,任何可直接支持馆藏的替代搜索引擎都将受到赞赏。
答案 0 :(得分:1)
目前尚不清楚该信息是否是每个用户。如果您需要每个用户的文件夹信息(即,如果用户A将文档D设置为文件夹F,则用户B在文件夹F中查找文档将找不到它),那么您需要存储与用户相关的一些信息太
我建议使用一些名为user_A,user_B等的动态字段,并在适当的用户字段中设置文件夹信息。
编辑:好的,那么Mark的回复还可以。只需记住在fq中使用'collection',它就会被缓存并在其他查询中重用。答案 1 :(得分:1)
具有多值字符串字段,用于指定给定文档所属目录的绝对路径。例如,文档可能属于documents/reports/fin/2012
和johns_stuff/to_read
。
一些疑问:
documents/reports/fin/2012 <-- belongs to a specific directory
documents/reports/fin* <--any subdirectory of this directory