我想使用distcp备份hbase文件。然后将hbase指向新复制的文件并使用存储的表。
我意识到有推荐用于这项工作的工具。但是,在我复制文件以使hbase识别复制的文件之后,我想知道我需要做什么。
例如,我想启动hbase shell并从新复制的文件中扫描存储的表。
答案 0 :(得分:1)
DistCp(分布式副本)是用于大型群集间/群集内复制的工具。因此,如果要将clusterA备份到clusterB,则必须:
这意味着有2个集群,每个集群都有HDFS和Hbase。
但是,如果您想在相同群集中备份数据,则更为简单:
在不同的文件夹中执行内部复制:hadoop distcp hdfs:// nn:8020 / hbase hdfs:// nn:8020 / backuptest
停止所有Hbase进程并将属性hbase.rootdir从“hbase”更改为“backuptest”