如何从tar.gz压缩的csv创建Panda Dataframe?

时间:2016-08-28 12:08:48

标签: python csv pandas gzip tar

如何从tar.gz中压缩的csv文件创建pandas DataFrame?我找到了这个代码,但是使用zip文件。在不下载tar.gz和csv文件的情况下,我应该在以下代码中更改以使其与tar.gz一起使用。

import pandas, requests, zipfile, StringIO
r =requests.get('http://data.octo.dc.gov/feeds/crime_incidents/archive/crime_incidents_2013_CSV.zip')
z = zipfile.ZipFile(StringIO.StringIO(r.content))
df=pandas.read_csv(z.open('sample_CSV.csv'))

我的档案是https://ghtstorage.blob.core.windows.net/downloads/mysql-2016-06-16.tar.gz

2 个答案:

答案 0 :(得分:1)

您可以尝试下面提取tar.gz,如下所示:

import tarfile
tar = tarfile.open(fname, "r:gz")
tar.extractall()
tar.close()

答案 1 :(得分:0)

尝试只提供.tar.gz文件作为文件名
read_csv它将自动解压缩并打开它,
因为这是gz个文件的默认行为。

确保扩展名为小写。