水壶 - 从文件夹中读取多个文件

时间:2013-09-30 14:49:12

标签: pentaho readfile kettle

我试图从文件夹中读取多个XML文件,编译他们拥有的所有数据(所有数据都具有相同的XML结构),然后将这些数据保存在CSV文件中。

我已经有一个'读取文件'转换,步骤为:获取文件名将行复制到结果,以获取所有XML文件。 (它正在工作 - 我打印一个包含所有文件名的文件)

然后,我输入' for-each-file'作业转化从结果步骤获取行,然后是另一个作业来处理这些文件。

我想我从'读取文件'中丢失了信息。转换转换为转换每个文件'作业,获取所有行。 (我打印另一个包含所有文件名的文件,但它是空的)

你能告诉我我是否以正确的方式思考?我必须设置一些变量,或者某些禁用的选项?感谢。

1 个答案:

答案 0 :(得分:1)

以下是“如何根据文件名处理一次水壶转换”的示例 http://www.timbert.net/doku.php?id=techie:kettle:jobs:processtransonceperfile