在为PDF / DOC编制索引后,集合中没有Solr“内容”字段

时间:2019-10-17 20:18:20

标签: solr

我有成千上万个文档/ pdf的集合,并且有很多字段,例如:url,title,date ...等。但是没有内容字段,为了让您能够按整个文档的关键字(而不仅仅是标题)进行搜索,似乎必须存在该内容字段。我看到有人说,通常,在索引时会自动生成content字段。

如何添加一个内容字段,其中应包含PDF / DOC中的所有文本?我在Solr 6上,所以我知道我需要使用API​​创建一个新字段以使用托管模式。但是之后,如何重新索引我的收藏集?如果我仅将新字段命名为“内容”,Solr会知道在重新索引索引时,“内容”字段应包含我的PDF / DOC中的所有文本吗?

1 个答案:

答案 0 :(得分:0)

创建“内容”字段无效!相反,我为_text_字段设置了stored = true,一切正常。