solr word文件词干

时间:2015-07-13 09:16:54

标签: solr lucene

Solr允许通过TIKA - ExtractingRequestHandler索引word文档。文档保存在"content"字段类型"text_general"中。但是,即使存在分析仪,文档中的信息也不会被删除,并且不会删除停止的单词 可能是什么原因?

作为快速修复,我们从solr读取文档并明确应用lucene analyzers(parsing,stop words, stemming)。 谢谢

0 个答案:

没有答案