大数据CMS全文搜索

时间:2012-06-12 18:28:27

标签: content-management-system full-text-search bigdata

目前我有一个用户上传文档的应用程序(pdfs / excel / word,几张图片)。寻找大数据(Hadoop-MangoDB)解决方案哪里可以

  1. 存储数以千计的pdf,word,excel文件(因为我们的规模也在增长)

  2. 搜索图片元信息

  3. 全文搜索(主要是实时)

  4. 更快的检索

  5. 请咨询

1 个答案:

答案 0 :(得分:0)

看看apache Hbase也..你可能会发现它对你的用例有用..这是一个在Hdfs之上运行的NOSQL数据库,提供随机的实时读/写访问权限。你可以看看Apache Hive也是如此。虽然不像Hbase那样不是实时处理,但它提供了一个基于Hadoop集群的数据仓库,具有类似SQL的界面..您可以在后台运行Hive作业并保持数据处理并准备好服务你知道提前处理的类型..如果你来自SQL背景,那将非常有用。