使用SOLR 4,我如何在其中使用HTML代码索引纯文本文档,而不会删除HTML?
示例,<b>bold text</b>
变为bold text
谢谢!
答案 0 :(得分:2)
您存储文本文档的字段的fieldType很可能正在实现solr.HTMLStripCharFilterFactory
。这是在文档存储在索引中时从文档中删除<b> </b>
标记。您可以在schema.xml文件中进行检查。
您需要修改此字段的fieldType,方法是删除CharFilterFactory或定义已删除的字段类型。有关设置架构的其他信息,请参阅以下资源。