我有这个不稳定的客户,想要在经过一些预处理之后将数据从HAWQ推送到GREENPLUM。有没有办法做到这一点?如果没有,是否可以在greenplum中创建一个从运行HAWQ的HDFS读取它的外部表?
任何帮助将不胜感激。
答案 0 :(得分:3)
最简单的方法 - 使用外部可写表将数据从HAWQ推送到HDFS,然后使用gphdfs协议使用外部可读表从Greenplum读取数据。在我看来,这将是最快的选择。
另一种选择是将数据存储在HDFS上的gzip压缩文件中,并直接从HAWQ使用它们。这样,当你在Greenplum中需要这些数据时,你可以像外部表一样查询它,
答案 1 :(得分:0)
HAWQ与Greenplum相同,只有底层存储是hdfs,
单向是您可以在HAWQ中创建一个外部(可写)表,它将您的数据写入文件,此后您可以在Greenplum中创建一个外部(可读)表,它将读取来自该创建文件的数据
另一种方式您可以使用标准输入/输出从一台服务器复制到另一台服务器,当需要将数据从开发环境提供给生产时,我会多次使用它,反之亦然
另一种方式您可以使用pg_dump / gp_dump为特定表/表表示备份,然后使用pg_restore / gp_restore进行恢复
由于