我真的很擅长机器学习。我有一个项目可以识别来自剪辑的给定声音,例如明智地发生了多少次。(例如:狗吠声)在音频片段中会有几个声音。我需要做的是从中识别出特定的声音。我发表了一些关于机器学习的文章。但我仍然缺乏知识从哪里开始这个项目,而且我已经没时间了。我尝试使用Matlab waveread功能绘制音频剪辑。但我不知道如何训练这样的模型并逐帧分析剪辑来识别特定的声音。
任何帮助都将非常感激。谁能告诉我怎么做?
我可以直接为声音执行模板匹配吗?
答案 0 :(得分:0)
尝试向您的机器学习模型提供从音频数据中重叠窗口获得的MFCC向量序列或流。这是一种更常见的音频指纹识别方法的基本开始。