如何使用Pentaho Data Integration阅读Golden Gate的路径文件

时间:2014-12-02 11:43:12

标签: pentaho kettle oracle-golden-gate

我正在尝试使用Pentaho Data Integration(KETTLE)阅读Golden Gate的路径文件,但我不知道该怎么做?任何人都可以帮我看看如何阅读金门大道的文件。

提前致谢。

此致 塞特希。

1 个答案:

答案 0 :(得分:1)

金门步道有一个非平凡的结构:

https://docs.oracle.com/goldengate/1212/gg-winux/GWUAD/wu_fileformats.htm

应该可以用PDI解析它,但是这样的解决方案会非常复杂。以下是一些可能的方法:

1)尝试将文件拆分为各个区域,然后逐个处理这些区域,可能需要进行子转换以使其保持模块化和有序化。

2)如果您要在文件中查找文本,您可以使用"从文件中加载文本" PDI市场中的插件。它使用Apache Tika尝试从文档中提取文本。

3)如果您愿意编写代码来执行此操作,它将为PDI创建一个很棒的插件:)当我遇到复杂的文件结构时,我通常会编写一个ANTLR语法来进行解析,然后我编写PDI插件来调用解析器并将值转换为PDI行(即表格)格式。