Google AI平台笔记本:熊猫看不到我的数据文件

时间:2020-03-24 20:19:12

标签: python pandas google-cloud-platform

由于我没有GPU,因此我正在使用AI平台笔记本来利用GPU。

JupyterLab代理成功启动,并且我的所有数据都显示在左侧的文件浏览器中。

但是,当我尝试使用pd.read_csv('path/to/my/file.txt')时,会出现错误File path/to/myfile.txt does not exist

无论我将数据放在何处,无论是否提供绝对路径或相对路径,都不会发生这种情况。

我是一名业余程序员,对这种云计算技术还是陌生的。与仅在PC上执行任务相比,在线执行任何操作确实非常困难。没有什么能像宣传的那样正常工作,我必须花费数小时来找到变通方法以运行基本代码。这是怎么回事?

谢谢。

1 个答案:

答案 0 :(得分:1)

我创建了一个由here (Kaggle)here (SO)组成的解决方案。

作为后续摘要,您必须将文件放在Google Cloud Project下的存储桶中。

首先,您必须安装适当的库:

!pip install google-cloud-storage
!pip install pandas

然后执行适当的导入:

import pandas as pd
import google.cloud.storage as storage
from io import BytesIO

然后通过提供您的项目ID创建存储客户端:

storage_client = storage.Client(project = "project-ID")

通过指定存储桶的名称来定义存储桶:

bucket = storage_client.get_bucket("bucket-name")

使用您要读取的文件中的数据创建一个blob

blob = storage.blob.Blob("your-file.csv",bucket)

以字符串的形式下载该blob的内容:

content = blob.download_as_string()

将数据读入熊猫:

data = pd.read_csv(BytesIO(content))

现在,您可以使用head()函数查看一些数据:

data.head()