我正在尝试使用Pentaho Data Integration(KETTLE)阅读Golden Gate的路径文件,但我不知道该怎么做?任何人都可以帮我看看如何阅读金门大道的文件。
提前致谢。
此致 塞特希。
答案 0 :(得分:1)
金门步道有一个非平凡的结构:
https://docs.oracle.com/goldengate/1212/gg-winux/GWUAD/wu_fileformats.htm
应该可以用PDI解析它,但是这样的解决方案会非常复杂。以下是一些可能的方法:
1)尝试将文件拆分为各个区域,然后逐个处理这些区域,可能需要进行子转换以使其保持模块化和有序化。
2)如果您要在文件中查找文本,您可以使用"从文件中加载文本" PDI市场中的插件。它使用Apache Tika尝试从文档中提取文本。
3)如果您愿意编写代码来执行此操作,它将为PDI创建一个很棒的插件:)当我遇到复杂的文件结构时,我通常会编写一个ANTLR语法来进行解析,然后我编写PDI插件来调用解析器并将值转换为PDI行(即表格)格式。