用于存储pdf,txt,ppt等的Nosql DB

时间:2014-02-24 11:40:46

标签: nosql cassandra

哪个NoSql数据库可用于存储pdf,文本文件,word doc,ppt等?谁能请一些建议。 是否可以将cassandra用于此目的。

1 个答案:

答案 0 :(得分:1)

用于存储文档和搜索文档的最佳NoSQL数据库是专用的搜索服务器,可选择由单独的存储解决方案支持。有两种搜索选项: Solr ElasticSearch 。对于简单的情况,您不需要为它们提供单独的存储后端;他们自己充当NoSql商店。如果内置(本地文件系统/ HDFS,如果在Hadoop上)不适合您的需要,您可以将实际数据卸载到单独的存储解决方案。

几乎任何面向文档或基于kv的NoSQL数据库都可以存储BLOB,这意味着您可以在任何存储文件中存储随机文档文件。所以问题是特定商店如何满足您的使用需求以及它与您正在考虑的搜索解决方案的集成程度。基于粗略的外观,对于常见选项,例如Cassandra,MongoDB,HBase,Riak等,存在一定程度的现有Solr集成。在某些情况下,ElasticSearch似乎缺乏支持。

就Cassandra而言,有一种产品与Solr集成,它被称为Solandra。这是一个不再积极开发的旧项目,但人们已经成功地在生产中使用它。如果您需要更高级的功能,或者遇到兼容性问题,还有DataStax Enterprise,这是一种从Solandra开发的商业产品。与此同时,我还没有看到Cassandra + ElasticSearch开箱即用的集成项目。