Pentaho数据集成 - 如何循环csv文件列,每列将创建一个表

时间:2014-10-28 09:30:54

标签: csv pentaho kettle

我是Pentaho数据集成的新手。我需要有关如何循环csv文件列的帮助/指南,每列将在其上创建一个表。

我能够通过文本文件输入和CSV输入步骤生成CSV文件。我的问题是我不知道循环通过CSV列的步骤。我试图在互联网上搜索,但我没有发现类似的问题。

Example: Account,Contact,Location Acct-01,"Name 1", "Location 1" Acct-02,"Name 2", "Location 2" Acct-03,"Name 3", "Location 3" Acct-04,"Name 4", "Location 4"

输出应创建3个表,即帐户,联系人和位置。

提前致谢。

1 个答案:

答案 0 :(得分:0)

  1. 首先,您需要在 CSV文件输入步骤中使用标题行存在。 现在,您的第一行包含您需要的所有名称。
  2. 要获得第一行,您可以使用示例行步骤获取它(仅提供行号)。
  3. 现在您需要将具有三个值的行拆分为三行。您可以先使用 Concat字段步骤,然后将字段拆分为行步骤。现在,您的表名有三行。
  4. 步骤执行SQL脚本允许您为每一行运行自定义SQL,例如create table ${column_name} (col1 varchar(10))。只是不要忘记使用每行执行变量替换