对于一个项目,我们需要调查现有的IBM Data Stage安装,在大量工作中执行大量的ETL。
作业流程图包含许多用作源的表(在MSSQL和Oracle中)以及目标(主要在Oracle中)。
我现在的问题是
如何找到某个Data Stage Project中所有作业使用的所有数据库表?
我查看了工具 - 高级查找,在那里我可以看到所有“表格定义”。但是,实际在作业中使用的大多数表都没有显示在那里,因为它们被定义为Data Stage所谓的“并行作业”,它实际上是针对数据库表的SQL查询。
我特别感兴趣的是找到由作业加载的TARGET表。
所以直言不讳地说,我希望能够回答“哪个工作加载表XY?”这个问题。
如果无法做到这一点,则可以采用自动方式提取作业使用的所有SQL语句。
我们可以访问IBM Websphere Data Stage和Quality Stage Designer 8.1
答案 0 :(得分:0)
导出作业会创建一个文本文件,详细说明作业的作用。在文本编辑器中打开导出文件,您应该能够通过简单的搜索找到SQL插入。首先搜索“INTO”和“FROM”等SQL关键字。
编辑:或者,如果使用的每个表都是通过导入表定义来定义的,那么您应该能够在文件夹中找到其类型的表定义。但是,这并不能说明表的使用位置和方式(哪个作业,插入或选择?),所以我建议第一种搜索导出文件的方法。