我在其中一门课上完成了作业。我需要用手机“制作”乐器。我在考虑制作这样的东西:
墙上(或板上)有一个音乐人员。然后,用户可以在该工作人员上粘贴音符并将他们的手机摄像头指向该墙。然后手机会检测到音符(可能是四分音符或半音符,甚至是G音符),然后播放连续的音符作为声音。音符将具有相同的大小和颜色,因为它们不会被绘制,我们将用纸或纸板制作它们。
我担心的是,是否可以使用openCv检测几种自定义已知形状(在这种情况下是一堆音符),以及它们与另一种形状(在这种情况下是工作人员的线条,或工作人员本身)的定位;如果没有,关于如何做到这一点的任何其他想法都会很棒。
也许你可以指出我在谷歌寻找什么的方向让我开始这件事。我有2个半月的时间来做这个项目(如果你知道这个是相关的),所以我将不胜感激任何帮助。提前谢谢你。
答案 0 :(得分:1)
你所要问的是如何解决这个问题的全貌。以下是一些让你入门的想法。
首先,您需要确定图像中音符的位置。如果你知道相机总是静止的,你可以做一些背景减法技术。更严格的方法是识别图像中的音符。
查看MNIST数据集。它有一堆手写的数字和相应的基本事实。你可以从这里开始并将其扩展到音符。首先,您可以use k-nearest对这些图像进行分类。