将翻转图像用于机器学习数据集

时间:2012-08-02 15:16:47

标签: machine-learning computer-vision

我遇到了二元分类问题。我正在尝试训练神经网络来识别图像中的物体。目前我大约有1500张50x50的图像。 问题是,通过水平翻转的相同图像扩展我当前的训练集是否是一个好主意? (图像不是对称的)

由于

4 个答案:

答案 0 :(得分:1)

我认为你可以在更大程度上做到这一点,不仅仅是水平翻转图像,而是将图像的角度改变1度。这将为您在训练集中的每个实例生成360个样本。根据算法的速度,这可能是确保算法不仅仅能够识别图像及其镜像的好方法。

这可能是一个好主意,但话说回来,我不知道图像识别的目标或领域是什么。我们假设图片包含字符,并且您要求图片识别软件确定图片是包含正斜杠/还是反斜杠\,然后翻转图片会使你的训练数据毫无用处。如果您的域名没有遭遇此类问题,那么我认为翻转它们甚至不同程度地旋转都是个好主意。

答案 1 :(得分:1)

我在AdaBoost中使用翻转图像并在课程中取得了巨大成功:http://www.csc.kth.se/utbildning/kth/kurser/DD2427/bik12/Schedule.php 来自zip“TrainingImages.tar.gz”。

我知道有一些关于在幻灯片中(在主页上)使用翻转图像的利弊信息,但我找不到它。另外一个很好的资源是http://www.csc.kth.se/utbildning/kth/kurser/DD2427/bik12/DownloadMaterial/FaceLab/Manual.pdf(连同幻灯片),通过不同的尺度和方向来寻找事物。

答案 2 :(得分:0)

如果图像补丁不对称,我认为翻转不是一个好主意。更好的想法是对训练集进行一些相似性变换,但有一些限制。增加数据集的另一种方法是向其添加高斯平滑模板。确保正样本和负样本的数量成比例。太多的积极和太少的负面可能会使分类器产生偏差并在测试集上产生不良表现。

答案 3 :(得分:0)

这取决于您的NN所基于的内容。如果要提取不依赖于图像中空间位置的旋转不变特征或特征(如直方图或其他),并使用这些特征训练您的NN,那么旋转将不是一个好主意。

如果您正在直接训练像素值,那么这可能是一个好主意。 更多细节可能会有用。