在转换之间传递数据(XML)

时间:2013-10-04 11:02:49

标签: xml pentaho kettle

我想执行包含3个转换的作业:

在第一篇文章中我读了一个XML文件; 在第二个我得到该文件的内容(所有字段); 最后,我将数据保存在CSV文件中。

如何在不丢失数据的情况下从第一次转换到第二次转换,然后在XML步骤的GET数据中使用它?

1 个答案:

答案 0 :(得分:2)

只要所有数据都适合内存,您就可以使用Copy rows to result步骤在包含作业的转换中存储结果集。然后在随后的转换中,您可以使用Get rows from result从作业中获得结果。

他们所指的'结果'只是存储在作业中的一个大缓冲区,因此它可用于该作业包含的任何转换。它类似于记录作业所触及的所有文件的文件“结果”。

如果您的数据集太大而无法保留在内存中,则需要在某处暂存数据。在数据库表中,或在某个地方的文件中。您可以考虑使用Serialize to file步骤。