文本文件输入忽略标签行

时间:2017-01-10 14:57:06

标签: pentaho pentaho-spoon

我在Pentaho有一个工作,文本文件输入步骤从制表符分隔的文本文件中读取。有时,当给出这个文件时,它们的行没有数据,但行填充了制表符,因为它们在excel中复制了空行。下面是Notepad ++中“空”行的屏幕截图。

enter image description here

有没有办法忽略这样的行?我尝试使用过滤器字符串 =标签数量添加过滤器条目,过滤器位置 = 0,过滤器停止 = Y,正面匹配 = Y.此过滤器似乎没有任何效果。

当作业运行时,它将所有这些视为空记录,但这会导致下一个作业表输出失败。如果没有办法用文本文件输入来解决这个问题,那还有另一个可以轻松清理坏记录的工作吗?

2 个答案:

答案 0 :(得分:0)

您可以使用Filter Rows检查一个或多个字段值。

您的转换看起来像:文字输入 - >过滤行 - >表输出。

答案 1 :(得分:0)

当我进行更多调试时,我发现Filter选项卡确实具有实现我想要的逻辑。而不是过滤器字符串=标签数量,过滤器位置= 0,过滤器停止= Y,正匹配= Y需要具有肯定匹配= N.此更改后,它开始正常工作。