我正致力于将数据索引功能设计到Solr中。我们正在使用Storm拓扑并拥有一个Hbase Bolt,它将数据添加到Hbase中。要求是我们在Hbase中添加的数据,也需要编入索引。
以下是选项:
前两个选项类似于事务,意味着Hbase和Solr,或者没有。但不确定,如果我们能做到这一点,因为我们正在大规模处理数据。
对于第三个选项,起点是Hbase,因此假定所有数据都在那里。但是,我们没有完全控制调试,因为我们必须将jar部署到Indexer环境中。
请帮助我,哪种设计更合适。
答案 0 :(得分:0)
经过一些分析,我们继续使用NGHbas索引器实现了设计。一个论点是我们不能在hbase和solr中保护相同的数据,因为我们无法大规模处理事务。我们也有类似的流数据设计。所以使用了设置