标签: lucene
我正在尝试使用lucene索引网页。因此,我正在使用doc.add(new TextField("content", webPageContent, Store.YES)),其中doc是要添加到索引的文档,而webPageContent是使用JSoup解析的网页内容的字符串。
doc.add(new TextField("content", webPageContent, Store.YES))
这是正确的方法 - 也就是说,lucene会计算从webPageContent创建的每个令牌的频率吗?