Question

由于我没有GPU，因此我正在使用AI平台笔记本来利用GPU。

JupyterLab代理成功启动，并且我的所有数据都显示在左侧的文件浏览器中。

但是，当我尝试使用pd.read_csv('path/to/my/file.txt')时，会出现错误File path/to/myfile.txt does not exist

无论我将数据放在何处，无论是否提供绝对路径或相对路径，都不会发生这种情况。

我是一名业余程序员，对这种云计算技术还是陌生的。与仅在PC上执行任务相比，在线执行任何操作确实非常困难。没有什么能像宣传的那样正常工作，我必须花费数小时来找到变通方法以运行基本代码。这是怎么回事？

谢谢。

Answer 1

我创建了一个由here (Kaggle)和here (SO)组成的解决方案。

作为后续摘要，您必须将文件放在Google Cloud Project下的存储桶中。

首先，您必须安装适当的库：

!pip install google-cloud-storage
!pip install pandas

然后执行适当的导入：

import pandas as pd
import google.cloud.storage as storage
from io import BytesIO

然后通过提供您的项目ID创建存储客户端：

storage_client = storage.Client(project = "project-ID")

通过指定存储桶的名称来定义存储桶：

bucket = storage_client.get_bucket("bucket-name")

使用您要读取的文件中的数据创建一个blob：

blob = storage.blob.Blob("your-file.csv",bucket)

以字符串的形式下载该blob的内容：

content = blob.download_as_string()

将数据读入熊猫：

data = pd.read_csv(BytesIO(content))

现在，您可以使用head()函数查看一些数据：

data.head()