Lucene执行文档相似性

时间:2012-01-13 02:52:53

标签: lucene indexing

我已经使代码通过找到它们的tf然后找到它们的余弦值来找到两个文档之间的相似性。但是当我看到lucene上的标准示例时,每个程序都使用了索引。 我的过程涉及一个参考文档与文件夹中的其他文档之间的比较。

你认为我应该使用索引吗?

1 个答案:

答案 0 :(得分:1)