我正在使用查询(Solr Admin)通过我的HDFS中的两个文本文档搜索单词。如何检索找到该单词的文档的名称。我正在使用此项目https://github.com/lucidworks/hadoop-solr
我正在使用bin/solr -e cloud
创建一个集合,我正在使用 server / solr / configsets / 目录中的“data_driven_schema_configs”。
我尝试在〜/ solr-6.1.0 / server / solr / configsets / data_driven_schema_configs / conf 中的 managed-schema 中添加<field name="fileName" type="string" indexed="true" stored="true" />
,还将其名称更改为 schema.xml ,但在此目录中没有任何dataConfig文件要添加<field column="file" name="fileName"/>
,因为我在其他一些有类似问题的帖子中看到它,但不是SolrCloud,所以我不知道我的尝试是否正确。我需要做些什么改变以及在哪些目录中才能实现它。
示例:我正在搜索两个文档中都能找到的“最大”这个词。如何查看每个结果中的哪个文档, sample1.txt 或 sample2.txt
答案 0 :(得分:3)
当你在IRC上提到这个问题时,我说过同样的事情:
您的Solr架构必须包含一个字段,您可以在其中放置名称,设置为stored =“true”,并且在索引时必须在每个文档中包含具有相关值的字段。大多数架构更改都需要完整的重新索引。