比较Accumulo vs Solr的数据?

时间:2017-12-20 18:07:23

标签: solr accumulo

我正在尝试将来自相同源XML的数据同时包含在Accumulo和Solr中。摄取到Accumulo的数据是遗留代码,而Solr是新代码。我可以使用SolrCloud轻松地从Solr中提取数据,并选择容易阅读的CSV或JSON。但我对如何轻松查看Accumulo中的数据感到茫然。我使用scan来查看数据,但它不易读取。有没有办法将Accumulo中的数据导出为CSV或类似的东西,以便于与其他数据集进行读取/比较?

1 个答案:

答案 0 :(得分:1)

据我了解,Apache Solr是一个文档存储,它使用Lucene索引通过基于Web的REST接口快速搜索。另一方面,Apache Accumulo是一个可大规模扩展的有序键值存储,它根据用户的应用程序存储具有单元级安全标签的任意键值对,可通过Java API查询。比较两者是没有意义的。它们完全不同。 Accumulo是一个低级基础架构应用程序,您可以在其上构建复杂的系统,例如与Solr相当的搜索引擎,但它不能与Solr直接比较,因为Accumulo不是搜索引擎。

要回答有关如何在Accumulo中查看数据的问题,答案是使用其Java API。我建议从其网页上的Tour开始,以获取有关如何查询它的一些示例。至于如何呈现数据以及以何种形式呈现数据,这取决于首先摄取数据的应用程序。它可以是字节数组中的任意二进制数据,也可能无法直接查看;这取决于应用程序。 Accumulo与存储在其键值对中的数据的性质无关。

你在问题​​中可能提到的是什么,当你说"我用扫描来查看数据" 时,你可能指的是scan命令在Accumulo的贝壳里。您可能应该知道shell不是查询的主要接口。它用于系统管理和数据摄取分类。 Java API是查询的主要方式。

Accumulo开源社区对问题非常敏感。如果您在确定如何最好地满足您的需求时遇到问题,我建议您在社区邮件列表中查询,这些列表可以在他们的网站上找到。 StackOverflow比普通的"入门"更适合非常具体的问题。各种教程。