设置solr删除维基百科标记和HTML

时间:2013-11-24 20:59:33

标签: solr wikipedia

我应该使用哪些tokenizer工厂在索引和查询期间删除wikimarkup?

1 个答案:

答案 0 :(得分:0)

HTMLStripCharFilterFactory应该可以帮助您删除HTML字符。