我打算在我的一个项目中使用Apache lucense,我想根据文件属性索引文件(我不会索引数据),我希望lucense查询索引,以便我可以快速找到基于属性的文件列表。
请注意:给我所有访问时间大于10月10日的文件和访问时间小于10/04/2010的文件以及由詹姆斯创建的文件。
我可以将Lucene用于这类项目吗?或者我更好地使用Windows搜索(foor打印非常重,差不多5 MB :()而且我必须捆绑这个作为我的应用程序的一部分似乎很难。
你能否建议在这里有更好的选择吗?
我可以使用apache POI或Apache Tika,这样我就不需要进行大量处理了吗?
答案 0 :(得分:0)
Lucene绝对是索引文件属性的可行选项,我过去做过非常相似的事情(根据图像属性搜索图像)。
我稍微关心获得这些属性。您是否计划在File类中使用API?快速浏览,我发现API非常有限;因此,您可能在其他地方获得这些属性并将它们存储在中间介质中。
Lucene的另一种选择是Sphinx,它看起来更轻盈(根据我的经验和观察,Lucene对于更大的数据集更好,在数百万的范围内)。我从未与狮身人面像合作,但听过好话。在提交之前进行调查可能是值得的。