应用错误收集

将语音输入与现有音频源进行比较

时间：2017-05-11 14:34:27

标签： audio spectrum

我正在制作一个脚本配方，用于将音频输入与现有音频源进行比较，并返回任意匹配。

这个想法是语音输入无法转换为文本。这些将是声音，如狗（“woof”）或猫（“喵”）声音输入。

最后，我希望脚本能够得出结论输入是猫还是狗的声音，或两者都不是。

据我所知，需要对声音输入进行预处理（低通;降噪等），然后对声音进行频谱分析，然后将其与数据库中现有的频谱分析进行比较，但我不知道从哪里开始。

这类小项目是否有任何图书馆可以提供帮助？
如何比较频谱分析？
频谱分析比较如何考虑两个不同的人可以发出相同的喵声的可能性？是否考虑了与特定资源的匹配？

感谢您就此事提供任何指导。

0 个答案:

没有答案