应用错误收集

无法在spark中读取.zip文件

时间：2017-04-06 13:05:18

标签： hadoop apache-spark databricks

我能够通过spark csv读取.gz文件并获得预期的结果。但是在尝试阅读.zip文件时，火花会产生意想不到的结果，比如wV J .f Tn。

我访问了“ https://github.com/apache/hadoop/tree/trunk/hadoop-common-project/hadoop-common/src/main/java/org/apache/hadoop/io/compress ”，但未找到.zip文件的任何压缩编解码器。

我在stackoverflow上搜索但没有得到任何令人满意的结果。

如果有人遇到同样的问题或有任何解决方案，请提供更多信息。

0 个答案:

没有答案