使用ASCII分隔符的Pentaho加载纯文本文件

时间:2018-11-07 22:43:28

标签: ascii pentaho etl pentaho-spoon pentaho-data-integration

我正在尝试使用Spoon / Kettle上载以ASCII字符分隔的纯文本文件。当我在Kettle中预览文件的内容时,我可以看到所有数据,但是当我尝试在“内容”标签上预览行时,没有记录加载。

根据我的研究,在输入“ $ [value]”(在我的情况下为“ $ [01]”)时,Kettle应该理解我的字段分隔符。这是文件结构的描述:

提要中的每个文件均为纯文本格式,分为列和行。每个记录具有相同的字段集。以下是分隔符 每个字段和记录:

字段分隔符(FS):SOH(ASCII字符1)

记录分隔符(RS):STX(ASCII字符2)+“ n”

任何以“#”开头和以RS结尾的记录都应被本人视为注释,并被忽略。数据提供者还在文件的开头生成了一个列标题行,列出了字段数据类型。

所以我的输入参数是:

文件类型:固定

分隔符:$ [01]

附件:

转义:

...

格式:DOS

编码:US-ASCII

长度:字符

我无法读取任何记录,也不确定这是否正确。用水壶内的Java提取此数据会是更好的方法吗?

任何对此的帮助将不胜感激。谢谢!

0 个答案:

没有答案