目前我有一个用户上传文档的应用程序(pdfs / excel / word,几张图片)。寻找大数据(Hadoop-MangoDB)解决方案哪里可以
存储数以千计的pdf,word,excel文件(因为我们的规模也在增长)
搜索图片元信息
全文搜索(主要是实时)
更快的检索
请咨询
答案 0 :(得分:0)
看看apache Hbase也..你可能会发现它对你的用例有用..这是一个在Hdfs之上运行的NOSQL数据库,提供随机的实时读/写访问权限。你可以看看Apache Hive也是如此。虽然不像Hbase那样不是实时处理,但它提供了一个基于Hadoop集群的数据仓库,具有类似SQL的界面..您可以在后台运行Hive作业并保持数据处理并准备好服务你知道提前处理的类型..如果你来自SQL背景,那将非常有用。