我正在对图像中的文本进行对象检测,并希望使用Yolo在图像中的文本处绘制一个边界框。
然后,您如何进行数据扩充?另外,普通图像识别中的增强(对比度调整,伽玛转换,平滑,噪声,反演,缩放等)之间有什么区别?
如果您有任何有用的网站链接,请告诉我:)
答案 0 :(得分:0)
如果您的意思是应该使用什么,那么它只是常规的对象检测任务,常见的增强功能(如翻转或修剪)都可以正常工作。
不同之处在于,如果您要表示输出图像的外观,那么请查看此仓库https://github.com/albumentations-team/albumentations
但是,由于模型性能差异,您可能无法解决这个问题,您只能尝试几种方法,看看哪种方法最好。