我是Apache Lucene的新手。
是否可以在Apache Lucene中存储文件(例如pdf,doc)以及稍后检索它?或者,如果我必须将这些文件存储在其他地方,只是用它来编制索引?
答案 0 :(得分:0)
从技术上讲,你可以,当然,存储文件的内容(例如在StoredField
或其他地方),但我看不出你应该<的原因/ strong>即可。在序列化和反序列化文件内容时,这将不会带来任何附加价值,但是您仍然需要将文件名保留在其他位置。除了序列化/反序列化的痛苦,你的应用程序可能必须阻止更长时间,而Lucene将合并索引段。
最好的方法IMO是存储相对于某个文件存储库根目录的文件路径 - 例如如果您的文件位于/home/users/bob/files/123/file.txt
,您可能希望存储files/123/file.txt
部分而不进行标记化(使用StringField
)。