在Spark中读取CSV快照压缩文件时出现数据问题

时间:2020-09-23 14:24:44

标签: apache-spark snappy

火花作业 输入-CSV快照压缩文件 输出-CSV文件

我们在输出文件中遇到了一个数据问题,在该文件中,我们看到字符替换为其中一个字段。

在发现数据问题的字段上,我们不做任何转换或处理。输入和输出之间的值应该相同。对于某些行而不是所有行,都会发生此问题。

例如: 该字段的值应为53540,而不是C3540 该字段的值应为25367,而不是C5367

0 个答案:

没有答案
相关问题