如何对图像中的文本(对象检测)进行数据增强

时间:2019-12-28 10:04:43

标签: python deep-learning image-recognition data-augmentation

我正在对图像中的文本进行对象检测,并希望使用Yolo在图像中的文本处绘制一个边界框。

然后,您如何进行数据扩充?另外,普通图像识别中的增强(对比度调整,伽玛转换,平滑,噪声,反演,缩放等)之间有什么区别?

如果您有任何有用的网站链接,请告诉我:)

1 个答案:

答案 0 :(得分:0)

如果您的意思是应该使用什么,那么它只是常规的对象检测任务,常见的增强功能(如翻转或修剪)都可以正常工作。

不同之处在于,如果您要表示输出图像的外观,那么请查看此仓库https://github.com/albumentations-team/albumentations

但是,由于模型性能差异,您可能无法解决这个问题,您只能尝试几种方法,看看哪种方法最好。