应用错误收集

我希望为大型数据集实施一个存储和搜索解决方案，该解决方案拥有超过400万个文档。每个文档将包含40个或更多字段（或搜索条件）

之前我曾与Lucene和Solr合作，因此我倾向于将它们用于此问题（当然欢迎任何其他想法和解决方案）。但令我烦恼的是高效且可扩展的存储。我一直在寻找Cassandra和MongoDB以及其他一些NoSQL解决方案，但无法确定哪种技术可以满足要求。

我想问一下是否有人遇到过类似的问题以及他/她用来解决的问题..