从gcp存储桶中读取Excel工作表

时间:2019-09-04 22:13:47

标签: gcp-ai-platform-notebook

我目前正在尝试从共享的gcp存储桶中将数据读入我的gcp笔记本中。我是一名管理员,因此就我所知,限制不应该适用,但是在读熊猫之前我遇到了一个错误。这可能吗?还是我会以错误的方式进行操作?

这是我尝试过的代码:

from google.cloud import storage
from io import BytesIO
import pandas as pd

client = storage.Client()
bucket = "our_data/deid"
blob = storage.blob.Blob("B_ACTIVITY.xlsx",bucket)

content = blob.download_as_string()

df = pd.read_excel(BytesIO(content))

我希望在指定存储桶后简单地将数据引入,但是出现错误“'str'对象没有属性'path'”。

1 个答案:

答案 0 :(得分:0)

bucket必须是一个存储桶对象,而不仅仅是一个字符串。

尝试将该行更改为

bucket = client.bucket(<BUCKET_URL>)

这是构造函数的链接: https://googleapis.dev/python/storage/latest/client.html#google.cloud.storage.client.Client.bucket