我有一个IBM的BigInsight集群,我有~5k Hive表和其他HBASE数据以及一些Big SQL表。所有数据文件都采用不同的格式,即Text,Avro,bz2等。 现在要从BigInsight迁移到HDP(Hortonworks数据平台),我需要了解如何将数据从GPFS移动到HDFS。
我有一些选择:
我唯一担心的是所有这些选项中的哪一个可以适用于GPFS和HDFS。如果没有针对我的场景测试这些,我应该选择的其他替代选项是什么。
请建议任何解决方案,我需要注意的其他事项。
感谢。 问候, Pardeep Sharma。