是否可以在Apache Lucene中存储文件?

时间:2014-01-15 06:38:52

标签: apache pdf lucene store doc

我是Apache Lucene的新手。

是否可以在Apache Lucene中存储文件(例如pdf,doc)以及稍后检索它?或者,如果我必须将这些文件存储在其他地方,只是用它来编制索引?

1 个答案:

答案 0 :(得分:0)

从技术上讲,你可以,当然,存储文件的内容(例如在StoredField或其他地方),但我看不出你应该<的原因/ strong>即可。在序列化和反序列化文件内容时,这将不会带来任何附加价值,但是您仍然需要将文件名保留在其他位置。除了序列化/反序列化的痛苦,你的应用程序可能必须阻止更长时间,而Lucene将合并索引段。

最好的方法IMO是存储相对于某个文件存储库根目录的文件路径 - 例如如果您的文件位于/home/users/bob/files/123/file.txt,您可能希望存储files/123/file.txt部分而不进行标记化(使用StringField)。