标签: python image-processing data-augmentation
我想用NG与神经网络进行TTA预测边界框。
因此,在预测时间,假设我将预测图像的10个不同版本(增强),并平均输出。
扩展包括转换,缩放等转换。
一旦对增强图像进行了预测,如何将边界框反向转换回适合原始图像?
例如,如果不适用,则应用1.15的缩放系数,然后将图像向model.predict(...)的左侧左移25 px。然后应首先将输出边界框向右平移25px,并应用1 / 1.15的缩放比例。
如果imgaug尚未实现它,那么拥有扩展历史记录就足够了,以便我的脚本应用边界框