无法在spark中读取.zip文件

时间:2017-04-06 13:05:18

标签: hadoop apache-spark databricks

我能够通过spark csv读取.gz文件并获得预期的结果。但是在尝试阅读.zip文件时,火花会产生意想不到的结果,比如wV J .f Tn。

我访问了“ https://github.com/apache/hadoop/tree/trunk/hadoop-common-project/hadoop-common/src/main/java/org/apache/hadoop/io/compress ”,但未找到.zip文件的任何压缩编解码器。

我在stackoverflow上搜索但没有得到任何令人满意的结果。

如果有人遇到同样的问题或有任何解决方案,请提供更多信息。

0 个答案:

没有答案