如何忽略pentaho作业中MS Excel输入中的隐藏列?

时间:2017-07-26 07:06:59

标签: pentaho pentaho-spoon pentaho-data-integration pentaho-report-designer pentaho-design-studio

在我的源提取中默认只有16列。

  1. 在我的第一个文件中,在sitename和。之间有4个隐藏列 CAMPAIGNNAME。
  2. 在我的第二个文件中,在sitename和。之间有2个隐藏列 CAMPAIGNNAME
  3. 同样聪明我的所有文件列都隐藏着不同的不同 格式。 请参阅我附上的图片。文件1 enter image description here ..文件2 enter image description here
  4. 那么如何为所有加载的文件制作一个pentaho作业。可以 你请帮忙吗?感谢。

1 个答案:

答案 0 :(得分:0)

文件数量少: 由于您似乎只有两个文件,最简单的可能是使用各自的格式吞下两个Excel文件,然后使用Select values仅保留相关列并合并它们以进行其余的转换。 / p>

PDI可以合并两个(或更多)输入流,但它要求输入具有完全相同的元数据(相同的列,相同的名称,相同的类型......),这是通过Select value

enter image description here

大量文件:

如果您有大量文件,则必须在没有列名称(即没有标题)的情况下读取它们,调用列A,B,C,D,...然后过滤掉您不是的coumns感兴趣并更改元数据。

最后你可以使用Metadata Injection Step