机器学习和模型训练

时间:2019-12-10 09:24:32

标签: machine-learning deep-learning

我正在一个机器学习项目中,正在使用Google Colab训练模型。 我已经克隆了存储库,并使用张量流框架构建了模型。

但是,我的数据集太大。在运行模型之前,我会想到两个问题:

1)如果我隔夜离开模型去接受训练,最明智的方法是知道我的训练已完成/在两次训练之间还剩下什么? (通过电子邮件的任何通知..或?)

2)如果互联网连接在两者之间中断,会发生什么情况

我的Google搜索未提供我可以理解的答案。对于解决查询的任何帮助,我们将不胜感激。

1 个答案:

答案 0 :(得分:0)

最多可以同时运行2个实例,这些实例已链接到您的Google帐户。继续保持体重,如果需要超过12个小时,请重新进行训练。

对于这么长的工作,最好投资VPS,但要回答您的问题,

  1. 在打开浏览器的情况下,在Colab上作业的最长寿命为12小时。因此,最好定期保存模型权重。一个在训练时备份体重的脚本是个好主意。

  2. 如果Internet连接断开,则笔记本计算机将运行90分钟,然后实例被视为空闲,然后将其回收。类似于关闭浏览器。