我需要确定较大图像中较小图像的存在。
比赛必须模糊,最好我应该知道它的匹配程度(%),但如果需要,我可以在完成比赛后计算我自己的准确度。
我的目标是将FFT(快速傅里叶变换)频谱图(音乐中的频率可视化)与原始音乐曲目相匹配。我匹配的小图像只是原始轨道的一个子集(在时间和频率范围内)(如下图所示)。
我应该从哪里开始?用于对象识别的相同算法是否适合此任务?
我主要寻找C#/ .Net库/样本,但也有关于实现和问题/陷阱的信息。
我正在考虑使用人工神经网络训练识别。有什么想法吗?
我想要匹配的图像的示例可能如下所示: http://img812.imageshack.us/img812/548/musicspectogram2.png
答案 0 :(得分:0)
图像关联可能有效。取决于您的完整图像和部分图像之间的差异。
Mathematica中的示例:
如果您发布完整和部分图像的完整示例,也许我们可以解决更多问题。
还存在其他替代方案:比较FFT和进行小波分析,仅列举两个。
答案 1 :(得分:0)
我认为将此问题视为图像识别问题忽略了问题的基本结构。具体来说,您可能希望了解Shazam如何解决问题。关于Quora的这个问题有几个有趣的链接:
http://www.quora.com/How-does-Shazam-work
首先,an academic paper描述算法。您会注意到它们也是从频谱图开始,但从那里使用针对该问题定制的算法选择少量地标。然后,他们基本上将其用作数据库中的指纹ID。
其次,an article on Slate可以理解为更高级别,但可能仍然有用。