应用错误收集

如何处理tar.gz文件的InputStream？

时间：2015-11-20 00:19:17

标签： scala apache-spark

我有一个tar.gz文件的inputstream。我正在寻找一种在Spark中处理它们的方法。有没有办法可以将它赋予sc.textfile()，以便它可以自行提取/解压缩？

我很难选择正确的方法来处理输入流。

我可以使用hadoopfile()的{{1}}方法吗？

任何帮助将不胜感激。

0 个答案:

没有答案