应用错误收集

如何处理本文中JFT-300M等非常不平衡的数据集＆＃34;重新审视深度学习时代数据的不合理有效性＆＃34;？

时间：2018-01-29 08:08:24

标签： deep-learning

在本文中，＆＃34;重新审视深度学习时代的数据的不合理效果＆＃34;，作者使用名为 JFT-300M 的新数据来探索大数据的影响深度学习。作者描述的数据集有很长的尾巴，事实上，尾部很重，有超过3K类别，每个类别少于100个图像，大约2K类别，每个类别少于20个图像。结论：我们的数据有很长的尾巴，但表示学习似乎有效。 这种长尾似乎并没有对此产生不利影响 ConvNets的随机训练（训练仍然收敛）。我想知道背后的原因，或者作者使用其他技术？

1 个答案:

答案 0 :(得分：0)

通常有很多方法，我认为合适的data augmentation总是一个好主意。

此外，关于2000多个课程，您可能会发现hierarchical softmax想法很有用。

如何处理这种不平衡类偏斜的数据集？
如何在ResNet论文中理解“运行5次”？
Hyperas：如何处理这个IndentationError？
使用新数据测试训练的ML模型 - 如何处理one_hot_encoding？
如何在tensorflow中处理大型（> 2GB）嵌入查找表？
如何处理本文中JFT-300M等非常不平衡的数据集＆＃34;重新审视深度学习时代数据的不合理有效性＆＃34;？
如何处理caffe HDF5中的大量数据以及如何设置test_iter？
Keras：如何处理语义分割任务中的不平衡类？
当数据不平衡时，将数据分成测试列车数据
如何在深度学习中处理嘈杂的图像

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？