我如何使用distcp备份hbase?

时间:2014-03-26 19:47:21

标签: hadoop hbase

我想使用distcp备份hbase文件。然后将hbase指向新复制的文件并使用存储的表。

我意识到有推荐用于这项工作的工具。但是,在我复制文件以使hbase识别复制的文件之后,我想知道我需要做什么。

例如,我想启动hbase shell并从新复制的文件中扫描存储的表。

1 个答案:

答案 0 :(得分:1)

DistCp(分布式副本)是用于大型群集间/群集内复制的工具。因此,如果要将clusterA备份到clusterB,则必须:

  • 使用distcp
  • 从clusterA复制到clusterB
  • 启动Hbase主服务器和一些RegionServers
  • 享受clusterB上的命令行界面

这意味着有2个集群,每个集群都有HDFS和Hbase。

但是,如果您想在相同群集中备份数据,则更为简单:

  • 在不同的文件夹中执行内部复制:hadoop distcp hdfs:// nn:8020 / hbase hdfs:// nn:8020 / backuptest

  • 停止所有Hbase进程并将属性hbase.rootdir从“hbase”更改为“backuptest”

  • 重启所有流程