我想知道内容字段与_text_
字段之间有什么区别。我在索引所有文档/ pdf时遇到问题,但是由于某种原因,我无法访问这些文档/ pdf中的实际文本/信息。我注意到我没有“内容”字段,所以我只创建了一个,目前正在重新编制索引。但是,我注意到我有一个_text_
字段,该字段已存储= false。这两个字段都取自document / pdfs的所有文本吗?
答案 0 :(得分:0)
_text_
是默认在新Solr内核上定义的字段(请参见https://lucene.apache.org/solr/guide/7_5/schemaless-mode.html)。
新的Solr核心中的默认managed-schema
文件不会显示任何内容来表示已填充任何内容,因此我怀疑是由您来填充它。
_text_
字段可用于转储文档中所有文本的副本,但这是您必须要做的(手动填充_text_
字段或使用{{1} }。)
copyFields
已被索引但未存储的事实意味着您可以在其中搜索文本(因为它已被索引),但无法获取并向用户显示其值(因为未存储)。