将文件/ URI并行加载到greenplum中的外部表

时间:2018-06-05 12:03:38

标签: greenplum external-tables

如果我在greenplum数据库的LOCATION中为CREATE EXTERNAL TABLE指定多个URI,它会并行加载文件吗?或者加载整个文件与将文件分成多个文件并加载它们没有区别? Official Doc

2 个答案:

答案 0 :(得分:1)

按命令按顺序加载文件。 如果指定多个文件,例如:gpfdist:// data / file_ *

然后所有这些文件将按顺序加载,并由所有段同时加载。

通过在多个gpfdist实例上拆分文件,您可以实现更快的并发加载。

例如: gpfdist://数据/ file_part_1 * gpfdist:// data / file_part_2 *

有关视频示例,请参阅: https://youtu.be/QqzUhTgWPZg?t=4m48s

答案 1 :(得分:0)

多个gpfdist实例将以并行方式在定义的位置加载/卸载数据。那才是greenplum db的真正用途