标签: .net indexing full-text-search lucene lucene.net
我正在使用Lucene。要进行全文搜索。直到现在我一直在索引PDF文档,但现在我有一些我需要索引的网页。索引HTML文档以添加到我的Lucene索引的最佳/最简单方法是什么?我正在使用.NET / C#
答案 0 :(得分:1)
我目前正在解决这个问题,我迄今为止找到的最佳答案是使用HTML Agility Pack从HTML中获取纯文本内容。
答案 1 :(得分:-3)
Google可以为您索引内容。