c++ - Caffe是否需要改组数据？

Caffe是否需要改组数据？

时间：2016-06-06 12:54:40

标签： c++ machine-learning neural-network deep-learning caffe

我使用C ++将我的图像数据转换为caffe db格式（leveldb，lmdb），例如我将此代码用于imagenet。

是否需要对数据进行洗牌，我可以写入所有积极因素，然后写入所有负面信息，例如00000000111111111，或者数据是否需要洗牌，标签应该看起来像010101010110101011010？

来自DB的caffe样本数据是如何使用size = batch_size的所有数据的随机子集？

1 个答案:

答案 0 :(得分：10)

你应该对样本进行洗牌吗？如果你没有洗牌，请考虑学习过程; caffe只看到0个样本 - 您期望算法推断出什么？只是简单地预测0，一切都很酷。如果你在点击第一个0之前有足够的1，那么caffe将非常有信心预测0。从这一点开始移动模型将非常困难另一方面，如果它经常看到0和1的混合，它会从头开始学习有意义的功能来分隔示例。
底线：对训练样本进行随机播放是非常有利的，尤其是在使用基于SGD的方法时。

AFAIK，caffe不会随机抽样batch_size个样本，而是在batch_size个样本之后依次在输入数据库batch_size上进行采样。

<强> TL; DR
洗牌。

相关问题

套接字数据是否需要纠错？

是否需要对所有POST数据进行清理？

为什么OrderedDict不能被洗牌？

混洗阵列数据重复

洗牌后的索引无需内存

Caffe何时复制数据？

是否需要在caffe中的deploy.prototxt中定义dropout层？

Caffe是否需要改组数据？

tensorflow是否支持.binaryproto进行数据标准化？

在将阵列改组之前将阵列记录到控制台...似乎被改组了吗？

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？