solr - solr word文件词干 - Thinbug

solr word文件词干

时间：2015-07-13 09:16:54

标签： solr lucene

Solr允许通过TIKA - ExtractingRequestHandler索引word文档。文档保存在"content"字段类型"text_general"中。但是，即使存在分析仪，文档中的信息也不会被删除，并且不会删除停止的单词可能是什么原因？

作为快速修复，我们从solr读取文档并明确应用lucene analyzers(parsing,stop words, stemming)。谢谢

0 个答案:

没有答案