使用CrateData索引和存储1百万个PDF文件

时间:2014-10-22 12:00:36

标签: lucene apache-tika crate

我们希望找到一种解决方案,使我们能够索引和存储数百万个PDF文件。我们目前使用Lucene + Tika,但将PDF作为blob存储在文件系统上(ZODB blobs)。

Crate.io可以用来索引和存储大量(数百万)PDF文件吗?

1 个答案:

答案 0 :(得分:2)

是的,当然,这是一个场景箱真的是为了。 也许这个最近的功能请求/讨论对您来说也很有趣:https://github.com/crate/crate/issues/1206