应用错误收集

我在其中一门课上完成了作业。我需要用手机“制作”乐器。我在考虑制作这样的东西：

墙上（或板上）有一个音乐人员。然后，用户可以在该工作人员上粘贴音符并将他们的手机摄像头指向该墙。然后手机会检测到音符（可能是四分音符或半音符，甚至是G音符），然后播放连续的音符作为声音。音符将具有相同的大小和颜色，因为它们不会被绘制，我们将用纸或纸板制作它们。

我担心的是，是否可以使用openCv检测几种自定义已知形状（在这种情况下是一堆音符），以及它们与另一种形状（在这种情况下是工作人员的线条，或工作人员本身）的定位;如果没有，关于如何做到这一点的任何其他想法都会很棒。

也许你可以指出我在谷歌寻找什么的方向让我开始这件事。我有2个半月的时间来做这个项目（如果你知道这个是相关的），所以我将不胜感激任何帮助。提前谢谢你。