我正在尝试在pentaho中处理固定宽度的输入文件并验证格式。该文件将是字符串,数字和日期的混合。但是,当尝试处理存在错误字符的数字字段(我预期会抛出错误)时,它只读取数字的第一部分并忽略坏字符。
我可以使用包含单个字段的非常简单的输入文件重新创建此问题:
我指定了预期的数字格式,以及起始位置和长度:
在运行转换时,我原本期望'Q'导致错误,而是显示以下结果,只读取前两位“67”并填充其余数字以匹配指定的格式:
如果输入文件格式正确,则运行得非常好,但是否则需要抛出错误。任何建议都会很棒。谢谢!
答案 0 :(得分:1)
仅仅是一个FYI,以防有人在遇到与我一样的问题后偶然发现这个问题。
我能够通过将“文本文件输入”步骤中的所有值作为字符串读取来构建变通方法,然后使用配备正则表达式评估的“数据验证器”步骤来确保数字在解析为数字类型之前已正确格式化以下“选择值”步骤。
为每个领域执行此操作需要更长的时间,但这是我能提出的最强大的解决方案。
由于