标签: solr lucene
Solr允许通过TIKA - ExtractingRequestHandler索引word文档。文档保存在"content"字段类型"text_general"中。但是,即使存在分析仪,文档中的信息也不会被删除,并且不会删除停止的单词 可能是什么原因?
"content"
"text_general"
作为快速修复,我们从solr读取文档并明确应用lucene analyzers(parsing,stop words, stemming)。 谢谢
analyzers(parsing,stop words, stemming)