不定搜索群集(Solr vs ES vs Datastax EE)

时间:2013-11-02 19:21:29

标签: solr elasticsearch datastax-enterprise

前言

这个问题并不是要求Elastic Search与Solr与Datastax Solr(Datastax EE)的开放式比较。 (虽然欢迎评论部分中的链接)。

项目:

我一直在构建域名类型的网络服务。在这样做的过程中,我意识到这种服务的指数增长。

背景

我想知道哪个特定的搜索平台允许我无限期地保存和扩展。是的,我意识到你现在可以拆分一个Solr碎片 - 所以如果我有一个20个碎片solr云,我可以稍后将它们分成40个(我想?再次......这不是无限的)。在弹性搜索方面还不确定。 Datastax(EE)似乎是答案,因为Cassandra的架构,但(A)因为他们没有透露许可证价格 - 我必须向他们透露我的earnings我很快就会想起甲骨文的流血你慢慢收费策略和我的初创公司是一个巨大的威慑力量。此外,(B)当他们说他们将完整的MapReduce与Hive,Sqop,Mahout,Solr和Pig整合在一起时 - 我想我不想花一辈子学习不适合我项目的花里胡哨。我想要一个搜索平台,我可以无限期地每月添加20亿个文档(或任何数量),而不必担心我在前期创建的分片太少了。

问题:

不可否认,我的背景部分因为无知而被打破,我想纠正。我的目的不是冒犯或淡化这些神奇的技术。我只是想知道哪些可以扩展而不必担心过度增长的碎片[我永远在这里取出了这个词 - 谢谢你在下面的评论]。或者可以吗?不是硬件方面,而是碎片。我可以使用哪个平台,无论是20TB还是2PB,都不必担心未来的增长。假设服务器,交换机等的硬件预算是不确定的。

2 个答案:

答案 0 :(得分:1)

DataStax Enterprise(DSE)不是一个"搜索平台"本身。 DSE提供的功能之一是能够搜索存储在Cassandra中的数据。 Cassandra用于存储和访问企业运营数据。我们的想法是,一旦您确定Cassandra是您的企业运营数据的首选数据存储,DSE / Solr集成就可以对该数据执行丰富的搜索。

大型企业正在寻求从传统的关系数据库迁移到更现代的平台,例如Noss数据库,例如Cassandra,其中可扩展性和分布式计算(包括多数据中心支持,可调整的一致性和强大的操作工具,包括OpsCenter GUI仪表板)是常态。 DSE的Solr集成有助于迁移。

答案 1 :(得分:0)

关于您的收入,该链接指向启动计划。如果您符合条件,这使得软件100%免费。