将语音输入与现有音频源进行比较

时间:2017-05-11 14:34:27

标签: audio spectrum

我正在制作一个脚本配方,用于将音频输入与现有音频源进行比较,并返回任意匹配。

这个想法是语音输入无法转换为文本。这些将是声音,如狗(“woof”)或猫(“喵”)声音输入。

最后,我希望脚本能够得出结论输入是猫还是狗的声音,或两者都不是。

据我所知,需要对声音输入进行预处理(低通;降噪等),然后对声音进行频谱分析,然后将其与数据库中现有的频谱分析进行比较,但我不知道从哪里开始。

  1. 这类小项目是否有任何图书馆可以提供帮助?
  2. 如何比较频谱分析?
  3. 频谱分析比较如何考虑两个不同的人可以发出相同的喵声的可能性?是否考虑了与特定资源的匹配?
  4. 感谢您就此事提供任何指导。

0 个答案:

没有答案