我已经通过Kaggle API将一些数据集下载到了Colab中。但是,将它们解压缩后,它们不会出现在我的目录中,我可以用熊猫阅读它们。
您会看到文件已成功解压缩,然后由于找不到文件,我再次将其解压缩。但是,它们没有出现在我提到的目录中。
此外,pd.read_csv
无法读取未显示的csv
文件或使用csv.zip
参数显示的compression = zip
。
我得到
FileNotFoundError: File b'/data/train.csv' does not exist
FileNotFoundError: [Errno 2] No such file or directory: 'data/train.csv.zip'
知道发生了什么吗?
答案 0 :(得分:0)
尝试像
那样分别解压缩它们!unzip train.csv.zip
然后做
train = pd.read_csv('train.csv', nrows=6000000, dtype={'acoustic_data': np.int16, 'time_to_failure': np.float64})
我是从这个github存储库中获得的,您可以按照以下步骤操作,也可以将其导入到colab中,然后将其替换为数据
https://github.com/llSourcell/Kaggle_Earthquake_challenge/blob/master/Earthquake_Challenge.ipynb
您可以通过在colab中搜索来导入.ipynb笔记本