我有一个zip文件,其中包含存储在Google云端存储实例的zip文件中的相对较大的数据集(1Gb)。
我需要使用Google Cloud Datalab中托管的Notebook来访问该文件及其中包含的数据。我该怎么做?
谢谢。
答案 0 :(得分:1)
您可以尝试以下方法吗?
import pandas as pd
# Path to the object in Google Cloud Storage that you want to copy
sample_gcs_object = 'gs://path-to-gcs/Hello.txt.zip'
# Copy the file from Google Cloud Storage to Datalab
!gsutil cp $sample_gcs_object 'Hello.txt.zip'
# Unzip the file
!unzip 'Hello.txt.zip'
# Read the file into a pandas DataFrame
pandas_dataframe = pd.read_csv('Hello.txt')