使用Lucene在Windows中查询文件属性

时间:2010-05-18 06:10:36

标签: lucene

我打算在我的一个项目中使用Apache lucense,我想根据文件属性索引文件(我不会索引数据),我希望lucense查询索引,以便我可以快速找到基于属性的文件列表。

请注意:给我所有访问时间大于10月10日的文件和访问时间小于10/04/2010的文件以及由詹姆斯创建的文件。

我可以将Lucene用于这类项目吗?或者我更好地使用Windows搜索(foor打印非常重,差不多5 MB :()而且我必须捆绑这个作为我的应用程序的一部分似乎很难。

你能否建议在这里有更好的选择吗?


我可以使用apache POI或Apache Tika,这样我就不需要进行大量处理了吗?

1 个答案:

答案 0 :(得分:0)

Lucene绝对是索引文件属性的可行选项,我过去做过非常相似的事情(根据图像属性搜索图像)。

我稍微关心获得这些属性。您是否计划在File类中使用API​​?快速浏览,我发现API非常有限;因此,您可能在其他地方获得这些属性并将它们存储在中间介质中。

Lucene的另一种选择是Sphinx,它看起来更轻盈(根据我的经验和观察,Lucene对于更大的数据集更好,在数百万的范围内)。我从未与狮身人面像合作,但听过好话。在提交之前进行调查可能是值得的。