我是Elasticsearch的新手,我试图看看这个问题的答案是否已经存在但是找不到它。我的问题是,我有多个数据存储区中的数据(Hadoop,cassandra,Oracle以及将来可能更多)。我想使用Elasticsearch来索引所有这些数据存储并创建“主索引”。这可能吗?索引处理还会将我的所有数据“移动”到EC吗?
答案 0 :(得分:2)
对于hadoop数据,您可以选择 ES-Hadoop-Connector 。在将数据转储到Elastic Search之前创建带映射的索引,然后使用相同的索引来保存数据。
Configuration conf = new Configuration();
conf.set("es.nodes", "localhost:9200");
conf.set("es.resource.write", "Index_Name/Document_Type");
同样,对于所有剩余的源,使用与sink相同的索引。对于每个源,更改具有相同索引名称的相应 Document_Type 。这样它就会成为你整个数据的主索引。