如何从tar.gz中压缩的csv文件创建pandas DataFrame?我找到了这个代码,但是使用zip文件。在不下载tar.gz和csv文件的情况下,我应该在以下代码中更改以使其与tar.gz一起使用。
import pandas, requests, zipfile, StringIO
r =requests.get('http://data.octo.dc.gov/feeds/crime_incidents/archive/crime_incidents_2013_CSV.zip')
z = zipfile.ZipFile(StringIO.StringIO(r.content))
df=pandas.read_csv(z.open('sample_CSV.csv'))
我的档案是https://ghtstorage.blob.core.windows.net/downloads/mysql-2016-06-16.tar.gz
答案 0 :(得分:1)
您可以尝试下面提取tar.gz,如下所示:
import tarfile
tar = tarfile.open(fname, "r:gz")
tar.extractall()
tar.close()
答案 1 :(得分:0)
尝试只提供.tar.gz
文件作为文件名
到read_csv
它将自动解压缩并打开它,
因为这是gz
个文件的默认行为。
确保扩展名为小写。