MXnet - 用于ROI池的ImageRecordIter和数据扩充启用了CNN

时间:2018-06-01 23:40:32

标签: deep-learning mxnet convolutional-neural-network

当我在使用MXnet开发的CNN网络中使用ROI-Pooling时,如何执行数据扩充?

例如,假设我有一个resnet50架构,它使用roi-pooling层,我想在ImageRecord Iterator中使用随机庄稼数据扩充。

是否有一种自动方式将rois中的数据坐标传递给roi池层,进行转换以便应用于ImageRecord Iterator的数据增强过程生成的图像中?

1 个答案:

答案 0 :(得分:1)

您应该可以重新调整ImageDetRecordIter的用途。它适用于包含边界框的对象检测数据,但您可以将边界框定义为ROI。现在,当您应用增强操作(例如翻转和旋转)时,边界框的坐标将与图像一起调整。

否则,您可以使用Gluon轻松编写自己的transform函数,并可以使用任何OpenCV扩充来应用于您的图像和ROI。只需编写一个获取数据和标签的函数,然后返回增强数据和标签。