我正在尝试从teradata sqoop导入,并且列有一些哈希值,其中包括大多数ascii字符。
因此我试图提到分隔符为扩展ascii(Dec-128)Ç(cedilla),hdfs文件有一些垃圾为Ã
hdfs中的数据使用cedilla
4182×27-1746296ÃCRYSTALDAWNMARTINDCÃ
问题是因为数据有很多垃圾,它几乎拥有数据中的所有ascii字符。 此外,我无法使用 ignore-data-delim 来逃避数据中的分隔符,因为它在Teradata中不受支持。