我制作了一个GPDB集群(5.18.0),并希望将一些本地镶木地板文件加载到GPDB中。如何实现呢?众所周知,gpload仅支持普通文件和cvs文件加载。
有什么方法可以弃用吗?谢谢!
答案 0 :(得分:0)
如果使用的是GP 5.18,则需要考虑使用PXF作为加载镶木地板文件的机制。这是文档概述的链接:
https://gpdb.docs.pivotal.io/5180/pxf/overview_pxf.html
其中包含有关如何配置PXF以及如何使用PXF实际加载数据的链接。检查有关访问Hadoop文件的部分-有关镶木地板的部分。
关于, 吉姆·麦肯(Jim McCann) 关键软件
答案 1 :(得分:0)
您可以在所有段服务器中安装Parquet工具,并使用gpfdist和“基于命令的” Web外部表提取Parquet数据。 Greenplum Web外部表可让您从段服务器到gpfdist服务器运行脚本。
答案 2 :(得分:0)
gphdfs也可以用于将Parquet数据加载到Greenplum中。 https://gpdb.docs.pivotal.io/580/admin_guide/external/g-hdfs-parquet-format.html
您的Hadoop发行版是什么?