删除Lucene.net Indexe update / build上的HTML标记

时间:2013-01-28 15:55:23

标签: c# asp.net lucene.net

是否可以让Lucene.net从我存储在lucene.net字段中的字符串中删除所有html-tags?

1 个答案:

答案 0 :(得分:1)

我不知道Lucene.net有任何内置的HTML Analyzer,但它应该很简单,可以使用像HTMLAgilityPack这样的解析器对您自己的Analyzer/Tokenizer进行编码。