SOLR 4 - 如何索引html纯文本

时间:2013-04-16 14:54:56

标签: solr

使用SOLR 4,我如何在其中使用HTML代码索引纯文本文档,而不会删除HTML?

示例,<b>bold text</b>变为bold text

谢谢!

1 个答案:

答案 0 :(得分:2)

您存储文本文档的字段的fieldType很可能正在实现solr.HTMLStripCharFilterFactory。这是在文档存储在索引中时从文档中删除<b> </b>标记。您可以在schema.xml文件中进行检查。

您需要修改此字段的fieldType,方法是删除CharFilterFactory或定义已删除的字段类型。有关设置架构的其他信息,请参阅以下资源。