Solr“内容”字段与“ _text_”字段

时间:2019-10-18 15:16:14

标签: solr

我想知道内容字段与_text_字段之间有什么区别。我在索引所有文档/ pdf时遇到问题,但是由于某种原因,我无法访问这些文档/ pdf中的实际文本/信息。我注意到我没有“内容”字段,所以我只创建了一个,目前正在重新编制索引。但是,我注意到我有一个_text_字段,该字段已存储= false。这两个字段都取自document / pdfs的所有文本吗?

1 个答案:

答案 0 :(得分:0)

_text_是默认在新Solr内核上定义的字段(请参见https://lucene.apache.org/solr/guide/7_5/schemaless-mode.html)。

新的Solr核心中的默认managed-schema文件不会显示任何内容来表示已填充任何内容,因此我怀疑是由您来填充它。

_text_字段可用于转储文档中所有文本的副本,但这是您必须要做的(手动填充_text_字段或使用{{1} }。)

copyFields已被索引但未存储的事实意味着您可以在其中搜索文本(因为它已被索引),但无法获取并向用户显示其值(因为未存储)。