由于我没有GPU,因此我正在使用AI平台笔记本来利用GPU。
JupyterLab代理成功启动,并且我的所有数据都显示在左侧的文件浏览器中。
但是,当我尝试使用pd.read_csv('path/to/my/file.txt')
时,会出现错误File path/to/myfile.txt does not exist
无论我将数据放在何处,无论是否提供绝对路径或相对路径,都不会发生这种情况。
我是一名业余程序员,对这种云计算技术还是陌生的。与仅在PC上执行任务相比,在线执行任何操作确实非常困难。没有什么能像宣传的那样正常工作,我必须花费数小时来找到变通方法以运行基本代码。这是怎么回事?
谢谢。
答案 0 :(得分:1)
我创建了一个由here (Kaggle)和here (SO)组成的解决方案。
作为后续摘要,您必须将文件放在Google Cloud Project下的存储桶中。
首先,您必须安装适当的库:
!pip install google-cloud-storage
!pip install pandas
然后执行适当的导入:
import pandas as pd
import google.cloud.storage as storage
from io import BytesIO
然后通过提供您的项目ID创建存储客户端:
storage_client = storage.Client(project = "project-ID")
通过指定存储桶的名称来定义存储桶:
bucket = storage_client.get_bucket("bucket-name")
使用您要读取的文件中的数据创建一个blob:
blob = storage.blob.Blob("your-file.csv",bucket)
以字符串的形式下载该blob的内容:
content = blob.download_as_string()
将数据读入熊猫:
data = pd.read_csv(BytesIO(content))
现在,您可以使用head()
函数查看一些数据:
data.head()