在Cloud Data Fusion中使用多字符定界符

时间:2019-11-25 14:25:47

标签: google-cloud-data-fusion cdap

我正在尝试在云数据融合中读取csv文件。 csv文件使用多字符(即〜^〜)定界符。当我尝试使用自定义定界符解析该列时,该工具仅考虑第一个字符并相应地拆分文件。我最终得到的列数超过了所需的列数,而且由于即使拆分并不完美,数据也可能具有字符。

我尝试不仅使用上述几种模式,而且每次使用相同的结果

如何解析使用多字符定界符分隔数据的文件。是否有可以使用的设置。使用牧马人之前,是否可以使用单独的转换来解析文件?

在作业中,我正在研究仅限于使用云数据融合作为我的etl工具

1 个答案:

答案 0 :(得分:2)

要实现此目的,可以使用以下指令:

拆分为列