应用错误收集

如何对图像中的文本（对象检测）进行数据增强

时间：2019-12-28 10:04:43

标签： python deep-learning image-recognition data-augmentation

我正在对图像中的文本进行对象检测，并希望使用Yolo在图像中的文本处绘制一个边界框。

然后，您如何进行数据扩充？另外，普通图像识别中的增强（对比度调整，伽玛转换，平滑，噪声，反演，缩放等）之间有什么区别？

如果您有任何有用的网站链接，请告诉我：）

1 个答案:

答案 0 :(得分：0)

如果您的意思是应该使用什么，那么它只是常规的对象检测任务，常见的增强功能（如翻转或修剪）都可以正常工作。

不同之处在于，如果您要表示输出图像的外观，那么请查看此仓库https://github.com/albumentations-team/albumentations

但是，由于模型性能差异，您可能无法解决这个问题，您只能尝试几种方法，看看哪种方法最好。