我想尝试使用mapreduce或sqoop将数据加载到Greenplum中。目前,从hdfs加载greenplum db的方法是,使用gphdfs创建一个extenrnal表,然后加载内部表。我想尝试使用sqoop或mapreduce将数据直接加载到greenplum中。我需要一些关于我如何继续这方面的意见。你能帮帮我吗?
答案 0 :(得分:0)
关于Sqoop, Sqoop export 将有助于实现这一目标。
答案 1 :(得分:0)
虽然不是sqoop,但我目前处于使用Greenplum外部表从hdfs加载的实验阶段。到目前为止似乎表现得很好。