machine-learning - 在Google Colab中训练pytorch模型导致精度模型比在本地GPU上的训练精度低，如何解决？

在Google Colab中训练pytorch模型导致精度模型比在本地GPU上的训练精度低，如何解决？

时间：2020-08-31 00:43:47

标签： machine-learning pytorch cloud precision tpu

我最近发现了Google Colab，并上传了我的Pytorch闪电项目，该项目与用于处理音频的训练模型有关。经过一些修改后，我得到了使用TPU训练模型的信息，但是我注意到模型的准确性比我在本地机器上训练的模型差了一半（损耗= 0.02 vs 0.009）。在两种情况下，我都使用相同的超参数。经过一番搜索，我了解到colab使用自己的类型“ bfloat16”而不是float32 precision来提高速度，不确定这是否是问题的一部分。是否有任何明显的原因导致TPU训练的模型准确性降低？如果重要的话，我的模型将使用一维一维卷积层的堆栈。

0 个答案:

没有答案

训练模型时如何解决GPU问题？
如何在本地rtx gpu的tpu上训练keras模型
为什么在训练模型时，我的模型的训练精度高而在部署模型时，它的训练精度低？
训练精度低会导致过度拟合吗？
在GPU上发布训练pytorch模型
在Colab上训练的simpletransformers模型在本地不起作用
训练模型时如何使用GPU？
如何在GPU上运行预训练的pytorch模型？
在Google Colab中训练pytorch模型导致精度模型比在本地GPU上的训练精度低，如何解决？
如何加载在Google Colab上训练的模型

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？