我已经下载了 IMDB 数据集并将其复制到我的 Google Drive 文件夹下的 imdb,我遇到的问题是我无法在 colab 下操作这个文件夹。据说它在“我的驱动器”中并查看了我已完成以下操作的解决方案:
from google.colab import drive
drive.mount('/content/drive')
它要求提供身份验证代码,我已经输入了。但是,当我执行以下操作时:
imdb="imdb"
trainD=os.path.join(imdb,"train")
testD=os.path.join(imdb,"test")
testlabels=[]
testtexts=[]
print(trainD)
trainlabels=[]
traintexts=[]
for labelType in ["neg","pos"]:
dirName=os.path.join(trainD,labelType)
print(dirName)
for fName in os.listdir(dirName):
if fName[-4:]==".txt":
f=open(os.path.join(dirName,fName),encoding="utf8")
print(f)
出现以下错误:
RROR:root:inspect 模块中的内部 Python 错误。 下面是这个内部错误的回溯。
imdb/train
imdb/train/neg
Traceback (most recent call last):
File "/usr/local/lib/python3.7/dist-packages/IPython/core/interactiveshell.py", line 2882, in run_code
exec(code_obj, self.user_global_ns, self.user_ns)
File "<ipython-input-26-a6dd3dffb70e>", line 12, in <module>
for fName in os.listdir(dirName):
OSError: [Errno 107] Transport endpoint is not connected: 'imdb/train/neg'
但是此子文件夹可用:训练和测试。我可以在本地驱动器中使用 Anaconda 读取这些文件夹,但不能在 Colab 中读取。有什么帮助吗?
答案 0 :(得分:1)
我想您应该使用绝对路径来访问您的云端硬盘中的内容,这就是您无法打开文本文件的原因。尝试将 imdb 变量的值替换为:
"/content/drive/MyDrive/path_to_your_imdb_folder/..."
不要忘记配置MyDrive文件夹之后的路径。
我希望它会奏效。
答案 1 :(得分:1)
运行下面的代码后,您将获得身份验证Url,必须登录 登录后使用谷歌帐户获取代码,然后粘贴到框中。
bysort season
稍微改变你的路径代码,也许这对你有帮助:
from google.colab import drive
drive.mount('/content/drive')