标签: lucene apache-tika crate
我们希望找到一种解决方案,使我们能够索引和存储数百万个PDF文件。我们目前使用Lucene + Tika,但将PDF作为blob存储在文件系统上(ZODB blobs)。
Crate.io可以用来索引和存储大量(数百万)PDF文件吗?
答案 0 :(得分:2)
是的,当然,这是一个场景箱真的是为了。 也许这个最近的功能请求/讨论对您来说也很有趣:https://github.com/crate/crate/issues/1206