从Google驱动器中将`.csv`文件导入Jupyter笔记本电脑

时间:2020-04-20 12:40:59

标签: python-3.x jupyter-notebook google-drive-api

我正在Covid-19上做一些工作,我不得不访问.csv上的Github文件。 (说实话,URL为https://github.com/CSSEGISandData/COVID-19/tree/master/csse_covid_19_data/csse_covid_19_time_series)。

因此,我转到此页面并直接在硬盘驱动器上下载了令我感兴趣的.csv文件:C: \ Users \ ... .csv 然后,我要做的就是将这些文件作为熊猫数据框导入到 Jupyter笔记本中,以通过以下代码进行编码,以使用Python:dataD = pd.read_csv ('C: / Users / path_of_my_file_on_my_computer ...')

一切都很好。

为了简化与其他人的聊天,我被告知应该将.csv文件导入到我的Google驱动器(https://drive.google.com/drive/my-drive)上,而不要导入C上,然后放在还有我在 Jupyter笔记本中创建的.ipynb文件,然后允许相关人员访问。

因此,我在驱动器上创建了一个文件夹(例如 Covid-19 ),将这些.csv文件放在其中,但是我不明白应该使用哪种Python代码在我的Python文件的开头写入以替换前面的简单指令dataD = pd .read_csv ('C: / Users / path_of_my_file_on_my_computer ...'),以便该程序直接从我的Google驱动器读取数据,而不再从我的C读取数据?

我看过各种各样的帖子,这些帖子似乎或多或少地谈到了这个问题,但是我真的不知道该怎么做。

我希望我的问题很清楚(我在Google云端硬盘中附上了这种情况的图片,假设它提供了有趣的信息……是法文) enter image description here

1 个答案:

答案 0 :(得分:0)

鉴于您的文件已经托管在云中,并且您正在计划一个协作方案,我认为@Eric提出的想法实际上更聪明。

方法1:

否则,如果您不能依赖该数据源,则必须为脚本构建授权流才能访问Google云端硬盘资源。您可以here查看有关如何构建Python脚本以及如何与Google Drive API进行交互的完整文档。

方法2:

尽管Google Drive API需要访问文件URL的授权,但是您可以构建解决方法。 Google云端硬盘会生成一些导出链接,如果您的文件公开可用,则可以未经授权访问这些链接。在this Stack Overflow answer中,您可以找到有关它的更多详细信息。

在您的Python脚本中,您将能够直接解析URL请求,而无需访问文件系统或Google驱动器授权流程。