标签: scala apache-spark
我有一个tar.gz文件的inputstream。我正在寻找一种在Spark中处理它们的方法。有没有办法可以将它赋予sc.textfile(),以便它可以自行提取/解压缩?
inputstream
sc.textfile()
我很难选择正确的方法来处理输入流。
我可以使用hadoopfile()的{{1}}方法吗?
hadoopfile()
任何帮助将不胜感激。