Pentaho水壶转换 - 跳过csv文件中的第1行

时间:2014-06-05 08:04:22

标签: file csv transformation pentaho kettle

我正在处理csv文件,csv文件的格式非常类似于:

第一行---第一行---
DEPTNO,DNAME,您所在的位置
10,会计,纽约 20,研究,DALLAS
30,SALES,芝加哥
40,操作,BOSTON

现在我想跳过第1行(),这个文件将被csv输入或文本输入步骤读取。 第二行是标题。

是否有任何方法或转型可以达到这个要求?

此时,我是CSV文件输入但我找不到。 我正在使用Pentaho 5.0.1

PS:抱歉我的英文

非常感谢

2 个答案:

答案 0 :(得分:3)

你可以将你的奇怪字符串放在字段标签中(“FIRST LINE --- FIRST LINE ---”),因为它是常规标题。然后使用拆分字段步骤拆分所有行。

否则,您可以使用“在内存中加载文件内容”步骤,并在内容选项卡中选中rownum字段。然后,您可以使用“过滤行步骤”跳过第一个。在此之后,您可以将所有内容放入新的csv文件中,这应该是正确的。

enter image description here

enter image description here

enter image description here

答案 1 :(得分:1)

您可以在文本输入组件的选项卡 Content 上定义标题行。请参见以下屏幕截图。

Content tab of text input component