我有一个问题,我需要帮助解决。我正在为之工作的业务是使用Informatica云将很多ETL用于AWS和其他服务。
我们为业务提供了一个平面文件,其中字段分隔符是“〜|”目前据我所知,informatica只接受一个字符分隔符。
有人知道如何克服这个问题吗?
答案 0 :(得分:0)
Informatica无法阅读composite delimiters。
首先,您可以将每一行作为一个单个长字符串提供给 表达转换。在这种情况下,分隔符应该 被设置为\ 037,我还没有看到这个字符(ASCII单位分隔符) 至少从1982年开始使用。然后使用InStr()的重复调用 在EXP内确定那些双管的位置 字符并使用SubStr()将每一行拆分为字段。
二 (在映射中更容易,会话更多工作)你可以提供 将文件存入某个实用程序,用于替换那些双管字符 字符ASCII 31(上面提到的单位分隔符);该 必须设置会话,以便从中读取输出 实用程序(输入文件类型= Command而不是File)。然后是来源 定义应该包含\ 037作为字段分隔符而不是 任何管道角色左右。