我能够通过spark csv读取.gz文件并获得预期的结果。但是在尝试阅读.zip文件时,火花会产生意想不到的结果,比如wV J .f Tn。
我访问了“ https://github.com/apache/hadoop/tree/trunk/hadoop-common-project/hadoop-common/src/main/java/org/apache/hadoop/io/compress ”,但未找到.zip文件的任何压缩编解码器。
我在stackoverflow上搜索但没有得到任何令人满意的结果。
如果有人遇到同样的问题或有任何解决方案,请提供更多信息。