快速HDFS和Hive数据复制

时间:2018-03-29 09:23:01

标签: hadoop hive hdfs replication

我正在考虑针对2个用例的集群之间的数据复制:

  1. DR(所以在2个数据中心之间进行复制
  2. 在两个生产群集之间同步
  3. 对于第一个,我倾向于认为猎鹰是正确的选择。但是对于第二个,我希望将数据复制为sson,因为它可用(意味着HDFS的放置结束,以及Hive的表创建结束)。你对此有何看法?

1 个答案:

答案 0 :(得分:0)

刚刚发现了ReAir https://github.com/airbnb/reair

似乎是一个很好的工具。 :)