通常,我使用JDBC连接和一些ETL工具将数据从一个数据库(即Teradata)移动到另一个数据库(即Greenplum)。
但是,这两个数据库都带有内置的实用程序,它们可以非常快速地加载/导出大量数据,比JDBC!快得多。但是据我所知,它的缺点是只能在文件中执行此操作。
因此,如果要使用它们,则必须遵循类似-
的过程Teradata ---(快速导出)--->文件---((Gploader)---> Greenplum
我想知道是否可以跳过“文件”部分并合并两个实用程序。
Teradata ---(FastExport&Gploader)-> Greenplum。
这样,我可以非常快速地传输大量数据!
答案 0 :(得分:0)
是的,您当然可以。 Greenplum支持各种外部表。一种解决方案是使用执行命令的外部表。该命令可以是连接到Teradata以获得数据并使用FastExport选项的Java程序。
我编写了工具“ gplink”来做到这一点。它自动为JDBC源创建Greenplum外部表。
Github: https://github.com/pivotalguru/gplink
Teradata连接示例: https://github.com/pivotalguru/gplink/blob/master/connections/teradata.properties