如何在pentaho中循环获取文件名?

时间:2012-12-07 14:12:48

标签: pentaho kettle

我有100 000个文件。 我想获取这些文件名的名称,并且必须放入数据库, 我必须这样做

  1. 获取10个文件名;
  2. 将名称更新/插入数据库;和
  3. 将这10个文件移动到另一个目录; 并循环这三个步骤,直到找不到文件。
  4. 这可能吗?

1 个答案:

答案 0 :(得分:6)

我附上了一个工作示例(我在水壶4.3上测试了大约400个文本文件。)。

transformation.ktr job.kjb

转化和工作都包含有关设置内容和位置的详细说明。

  • Transformation.ktr 它从给定的源文件夹中读取前10个文件名,为文件移动创建目标文件路径。它输出文件名以插入/更新(我使用虚拟步骤作为占位符)并使用“将行复制到结果集”来输出文件移动所需的源和目标路径。
  • job.kjb 所有循环都在此作业中完成。它执行“transformation.ktr”(插入/更新10个文件),然后将这10个文件移动到目标文件夹。之后,它会检查源文件夹中是否还有其他文件。如果有,则重复进程,如果没有,则声明成功。