首先,我试图从一张音乐中检测音乐符号。让我们说,在这种情况下,我们正在寻找此表http://upload.wikimedia.org/wikipedia/commons/f/ff/GClef.svg中的gclef http://www.anzacday.org.au/miscellaneous/lastpost.gif。
对于正样本,我使用了一个谱号图像并以我需要的角度旋转它以覆盖所有可能的形状,这些形状是书本之间的变化。 2000个样品,在haartrainer中使用1500。
对于阴性样本,我下载了3019个随机图像并使用它们,当然检查它们都没有gclef符号。负面图像是云,办公室,房屋,建筑物,树木,笔记本电脑。实际上我在stackoverflow上找到了它的链接,请不要让我去寻找它...使用3018负的样本。
负面样品是否重要?即如果我的负面样本是云和房子,我会得到更清晰的结果,如果它是,例如,没有谱号的乐谱?即阴性样本会影响物体检测吗?我已经创建了两个10-14阶段的级联文件,结果非常不同。但是,通过裁剪音乐表创建3000个负片样本是一个痛苦的屁股......
我的物体探测器不是为了在野外工作,而是仅在扫描的音乐片上工作,所以它唯一遇到的就是音乐符号......如果不是Haartraining,请指出出来!完成n00b,只是弄清楚我的方式。
答案 0 :(得分:4)
如果您不期待房屋,树木和汽车,为什么要将它们用于阴性样品? 更好地使用实际存在于图像中的图像补丁进行分析。 例如,低音谱号将更接近g谱号而不是树片。实际上,几乎每个图像上的符号都会更接近g谱号,而不是真实世界的图像,因为现实世界不是位图风格。
您是否在一次训练中使用了不同的谱号旋转?不要这样做!哈尔训练不是旋转不变的。如果您希望旋转图纸,最好旋转图像并对每个旋转的图像运行检测。
或者......你可以通过检测线条来检测你的纸张方向(例如用hough线),只旋转一次以得到一个直立的图像,然后运行检测。
你可以从几个样本开始进行测试(假设有10个正数,100个负数)。培训不会花那么长时间。 g谱号应该很容易训练,因为它非常有特色。如果您看到它正朝着正确的方向前进,您可以添加样本以优化探测器的质量。
祝你好运! :) 顺便问一下:你是小号手吗? ;)答案 1 :(得分:3)
是的,负面的确很重要,你应该在尽可能最佳的条件下训练你的分类器,即你在预测期间给出的图像,即音乐表的图像。因此,从没有g-clef的音乐表中提取的负片样本图像。您仍然可以将其他类型的图像添加到负片组中。
答案 2 :(得分:1)