将Google Colab ipynb推送到Github?

时间:2018-02-09 17:29:32

标签: git github google-chrome-os chromebook google-colaboratory

我使用的是Chromebook(库存设置),但对整个编码业务来说相对较新。目前,我正在尝试熟悉Google Colaboratory与Google Drive相结合,以便在任何地方进行数据分析。

我的问题是,因为我可以在Colab中自动通过!git访问Github,我创建了一个新的存储库并克隆了它。但是我无法添加.ipynb,因为!git status显示没有更改/没有看到我作为文件的笔记本。如何将.ipynb从我的Google云端硬盘推送回Github?

基本上,我希望在任何地方提取Colab,使用我的数据,保存.ipynb中的更改,推送到Github,然后转到其他地方继续播放数据。

手动复制可能会有效,但有更优雅的解决方案吗?

TIA!

2 个答案:

答案 0 :(得分:1)

你现在可能已经想出了一个解决方案,但我发现现在有一个"保存副本给Github" Colab中的功能,引自this blog post:

  

您还可以使用文件>轻松地将Colab笔记本的副本保存到Github。将副本保存到Github ......

答案 1 :(得分:0)

@jaymullr,您设法找到方法了吗?

这里是本教程,该课程介绍如何使用Clouderizer:Medium tutorial从github轻松将笔记本设置为Google Colab。好的,也许您想要的是另一种方法,将Google Colab转换为github。令人兴奋的事情是,使用clouderizer可以让您同时做到!同步您的jupyter笔记本,github和Colab。我的步骤可能要花很长时间,但实际上非常容易,一次设置所有步骤。这是我的操作方法(如果您只是想了解操作方法,请跳至同步回GitHub ):

适用于Google Colab项目的Clouderizer

先决条件

  1. 注册google / gmail帐户
  2. 注册Clouderizer account [链接]
  3. 在github上创建一个存储库,并将您的项目(所有ipynb,py模块,甚至数据集(如果<1GB,则将其压缩)上载)上传到存储库。

设置Clouderizer项目

  1. 登录到Clouderizer控制台。首次登录时,系统会提示您将Google云端硬盘与Clouderizer关联。按照屏幕上的说明进行操作。如果它不提示链接,则可以通过转到Clouderizer仪表板->侧边栏菜单-> Clouderizer Drive来配置Google云端硬盘。 Clouderizer将在您的Google云端硬盘中设置一个名为“ clouderizer”的文件夹,以包含您的ipynb项目(无论是机器学习还是其他项目)
  2. 返回Clouderizer仪表板。然后单击新项目。按照说明进行操作时,您可以选择加载包含要上传到Google Colab的ipynb工作的整个github项目。
  3. 在第5步中,您可以通过指定数据集的URL(例如来自kaggle数据集URL)来包含要处理的其他数据集。您还可以通过为数据集,主要代码/模块和输出文件使用单独的文件夹来选择并指定是否要重构项目。
  4. 接下来,转到Google Colab /在Google云端硬盘中的任意位置创建一个Google Colab文件,然后执行:!wget NS-内容处置'https://to_whatever_link_you_get_to_console'
  5. 最后,返回Clouderizer仪表板,检查您的项目环境是否已在运行并已同步到Google Colab。然后,在该仪表板中,在您提供的项目的标题名称旁边,单击jupyter笔记本图标。现在,您可以开始进行机器学习或从事其他工作,就像在本地计算机上一样,然后立即在Google Colab中进行同步。
  6. 最后,您将可以验证.ipynb是否可以运行,也可以在Google Colab中导入模块/数据集。只需返回Google云端硬盘-> clouderizer文件夹->您的项目即可。然后尝试运行,看看是否一切都在jupyter笔记本中正常工作。

同步回github

  1. 这里没什么特别的。返回Clouderizer jupyter笔记本,在根目录/顶层目录和$git push origin master中打开终端。就是这样!

如果您发现我的方式很有趣,请点击“ upvote”。但是,这种方法起初可能过于繁琐。让我知道你的想法! Clouderizer是免费的。