如何处理tar.gz文件的InputStream?

时间:2015-11-20 00:19:17

标签: scala apache-spark

我有一个tar.gz文件的inputstream。我正在寻找一种在Spark中处理它们的方法。有没有办法可以将它赋予sc.textfile(),以便它可以自行提取/解压缩?

我很难选择正确的方法来处理输入流。

我可以使用hadoopfile()的{​​{1}}方法吗?

任何帮助将不胜感激。

0 个答案:

没有答案