Solr-Retrieve找到单词的文档名称

时间:2016-09-10 14:45:11

标签: solr lucene apache-zookeeper solrcloud

我正在使用查询(Solr Admin)通过我的HDFS中的两个文本文档搜索单词。如何检索找到该单词的文档的名称。我正在使用此项目https://github.com/lucidworks/hadoop-solr

我正在使用bin/solr -e cloud创建一个集合,我正在使用 server / solr / configsets / 目录中的“data_driven_schema_configs”

我尝试在〜/ solr-6.1.0 / server / solr / configsets / data_driven_schema_configs / conf 中的 managed-schema 中添加<field name="fileName" type="string" indexed="true" stored="true" />,还将其名称更改为 schema.xml ,但在此目录中没有任何dataConfig文件要添加<field column="file" name="fileName"/>,因为我在其他一些有类似问题的帖子中看到它,但不是SolrCloud,所以我不知道我的尝试是否正确。我需要做些什么改变以及在哪些目录中才能实现它。

示例:我正在搜索两个文档中都能找到的“最大”这个词。如何查看每个结果中的哪个文档, sample1.txt sample2.txt

enter image description here

1 个答案:

答案 0 :(得分:3)

当你在IRC上提到这个问题时,我说过同样的事情:

您的Solr架构必须包含一个字段,您可以在其中放置名称,设置为stored =“true”,并且在索引时必须在每个文档中包含具有相关值的字段。大多数架构更改都需要完整的重新索引。

https://wiki.apache.org/solr/HowToReindex