当我在使用MXnet开发的CNN网络中使用ROI-Pooling时,如何执行数据扩充?
例如,假设我有一个resnet50架构,它使用roi-pooling层,我想在ImageRecord Iterator中使用随机庄稼数据扩充。
是否有一种自动方式将rois中的数据坐标传递给roi池层,进行转换以便应用于ImageRecord Iterator的数据增强过程生成的图像中?
答案 0 :(得分:1)
您应该可以重新调整ImageDetRecordIter
的用途。它适用于包含边界框的对象检测数据,但您可以将边界框定义为ROI。现在,当您应用增强操作(例如翻转和旋转)时,边界框的坐标将与图像一起调整。
否则,您可以使用Gluon轻松编写自己的transform
函数,并可以使用任何OpenCV扩充来应用于您的图像和ROI。只需编写一个获取数据和标签的函数,然后返回增强数据和标签。