在Google Cloud Datalab中从Notebook中读取存储在Google云端存储中的zip文件中的数据

时间:2016-06-02 13:24:46

标签: google-cloud-storage google-cloud-datalab

我有一个zip文件,其中包含存储在Google云端存储实例的zip文件中的相对较大的数据集(1Gb)。

我需要使用Google Cloud Datalab中托管的Notebook来访问该文件及其中包含的数据。我该怎么做?

谢谢。

1 个答案:

答案 0 :(得分:1)

您可以尝试以下方法吗?

import pandas as pd

# Path to the object in Google Cloud Storage that you want to copy
sample_gcs_object = 'gs://path-to-gcs/Hello.txt.zip'

# Copy the file from Google Cloud Storage to Datalab
!gsutil cp $sample_gcs_object 'Hello.txt.zip'

# Unzip the file
!unzip 'Hello.txt.zip' 

# Read the file into a pandas DataFrame
pandas_dataframe = pd.read_csv('Hello.txt')