标签: hadoop hive hdfs replication
我正在考虑针对2个用例的集群之间的数据复制:
对于第一个,我倾向于认为猎鹰是正确的选择。但是对于第二个,我希望将数据复制为sson,因为它可用(意味着HDFS的放置结束,以及Hive的表创建结束)。你对此有何看法?
答案 0 :(得分:0)
刚刚发现了ReAir https://github.com/airbnb/reair
似乎是一个很好的工具。 :)