如何在pyspark中解压缩tar.gz文件? tar.gz中有10个文件。我只想读取10个文件中的一个

时间:2019-12-13 22:36:43

标签: pyspark pyspark-dataframes

如何在pyspark中解压缩tar.gz文件? tar.gz中有10个文件。 我只想读取10个文件中的一个。我需要使用pyspark解压缩。

1 个答案:

答案 0 :(得分:0)

通过使用以下命令,可以解压缩文件。之后,您可以读取所需的文件。

命令:           须藤tar -xvzf filename.tar.gz