用于索引多个数据库的Elasticsearch

时间:2015-12-30 03:18:47

标签: hadoop elasticsearch

我是Elasticsearch的新手,我试图看看这个问题的答案是否已经存在但是找不到它。我的问题是,我有多个数据存储区中的数据(Hadoop,cassandra,Oracle以及将来可能更多)。我想使用Elasticsearch来索引所有这些数据存储并创建“主索引”。这可能吗?索引处理还会将我的所有数据“移动”到EC吗?

1 个答案:

答案 0 :(得分:2)

对于hadoop数据,您可以选择 ES-Hadoop-Connector 。在将数据转储到Elastic Search之前创建带映射的索引,然后使用相同的索引来保存数据。

    Configuration conf = new Configuration();
    conf.set("es.nodes", "localhost:9200");
    conf.set("es.resource.write", "Index_Name/Document_Type");

同样,对于所有剩余的源,使用与sink相同的索引。对于每个源,更改具有相同索引名称的相应 Document_Type 。这样它就会成为你整个数据的主索引。