我在Windows 7计算机上运行Solr 6.4.1,Chrome目前正在测试查询网址。
我已经设置并在一组测试文档上编写索引 - 少量网页在文件夹中保存为Docx文件。我可以得到基本的查询工作,现在我正在努力突出工作。
我没有以任何方式修改架构 - 只需将文件夹索引到名为test的Core中。
我期望的以下查询和要点:
http://localhost:8983/solr/test/select?hl=on&hl.fl=meta_author&q=steven&wt=xml&fl=meta_author
并返回
...<lst name="highlighting">
<lst name="C:\Users\steven\Documents\Indexing\Dungeon Arena Building.docx">
<arr name="meta_author">
<str><em>steven</em></str>
</arr>
</lst>...
但是,如果我更改字段,请尝试并突出显示在文档名称中找到该字词的位置,但这样做不起作用。
http://localhost:8983/solr/test/select?hl=on&hl.fl=dc_title&q=gothic&wt=xml&fl=dc_title
返回
...<lst name="highlighting">
<lst name="C:\Users\steven\Documents\Indexing\Basic Gothic Dungeon.docx"/>
<lst name="C:\Users\steven\Documents\Indexing\Dungeon Arena Building.docx"/>
</lst>...
结果是正确的,但它不会突出显示已识别的数据字段。
是否有一些可以突出显示的可用字段的规则,或者我需要修改架构中的某些内容?
对于上下文,我的目标是将所有文件内容带入索引,以便我可以在周围文本的上下文中呈现匹配,供用户查看。
答案 0 :(得分:0)
检查该字段是否存储为dc_title
。
在您的架构中,您的字段应该如下(字段类型可以不同,如您所定义,但设置stored = true),修改后,重新索引文档并再次搜索。
<field name="dc_title" type="text_general" indexed="true" stored="true"/>