我正在尝试创建一个应用程序,用户可以在其中录制一个小的音频剪辑 - 或者来自麦克风的实时音频,并发出短暂的噪音,如水龙头。该应用程序然后分析其频率或音高,以便以后记住它。
我遇到了一个名为Audio kit的强大框架,这似乎有一个非常好的示例应用程序,至少可以让我开始。 http://audiokit.io/examples/MicrophoneAnalysis/
但是,如果运行此功能不能为短时间的音频爆发提供可用的结果,例如在桌面上敲击和拍击。
我很欣赏这个例子更适用于人声或音乐音调检测 -
exiftool
我检查了音频套件网站,建议在此处使用相应的标签发布问题
所以我的问题是 - 是否可以通过框架实现这一点 - 理想地检测短音频的频率,足以区分两个响亮的声音(例如有人拍打他们的胸部和然后他们的大腿)< / p>
或者是否有我应该关注的替代框架(我是iOS开发者)
答案 0 :(得分:1)
要做的第一件事是确定两种类型的水龙头之间是否存在统计上显着的差异。
您可以录制每个样本的一组样本,然后使用音频分析工具(例如使用Audacity或MatLab的频谱图)检查它们。然后,如果可能的话,您可以查找某个特定的框架,而不是可靠地检测到您发现的任何差异。或者,如果您可以收集数以千计的标记声音样本,您可以将它们提供给一些深度学习工具,并将结果与iOS MLKit一起用于推理。