如何在Google Cloud Platform jupyter笔记本中读取csv文件

时间:2020-05-22 13:45:01

标签: google-cloud-platform jupyter-notebook

我正在使用Google云平台AI笔记本中的Jupyter笔记本。现在,我想在GCP中读取.csv文件,该文件存储在本地笔记本电脑中。

我的方法:

# First load indices im = Image.open('indices.pgm') # Now load palette palette = np.fromfile('palette.csv',sep=',').astype(np.uint8) # Put palette back into image im.putpalette(palette) # Save im.save('result.png')

但是它不起作用。如何在GCP AI notebbok中读取本地文件。

1 个答案:

答案 0 :(得分:1)

我认为没有直接的方法可以做到这一点,但是这里有三种选择:

a)从Jupyter UI上传文件:

1。打开Jupyter UI。

2。在屏幕的左窗格中,菜单下方的顶部,单击"Upload files"按钮。

3。从本地文件系统中选择文件,然后单击“打开”。

4。一旦文件在屏幕的左窗格中可用,请右键单击该文件,然后选择"Copy Path"

5。在笔记本中,键入以下代码,将test.csv替换为刚复制的路径:

import pandas as pd    
df2 = pd.read_csv("test.csv")
print(df2)

b。将文件上传到Notebooks实例的文件系统

1。转到GCP控制台中的Compute Engine screen

2。使用SSH按钮将SSH连接到您的AI Platform Notebooks实例。

3。在新的终端窗口中,点击齿轮图标和"Upload File"选项

4。从本地文件系统中选择文件,然后单击“打开”。

5。该文件将存储在$ HOME /中,可以选择将其移动到所需的路径。

6。在笔记本中,键入以下代码,并相应地替换路径:

import pandas as pd
df = pd.read_csv("/path/to_file/test.csv")
print(df2)

c)将文件存储在GCS存储桶中。

1。Upload your file to GCS

2。在笔记本中,键入以下代码,并相应地替换存储桶和文件名:

import pandas as pd
from google.cloud import storage
from io import BytesIO
client = storage.Client()
bucket_name = "your-bucket"
file_name = "your_file.csv"
bucket = client.get_bucket(bucket_name)
blob = bucket.get_blob(file_name)
content = blob.download_as_string()
df = pd.read_csv(BytesIO(content))
print(df)