标签: audio spectrum
我正在制作一个脚本配方,用于将音频输入与现有音频源进行比较,并返回任意匹配。
这个想法是语音输入无法转换为文本。这些将是声音,如狗(“woof”)或猫(“喵”)声音输入。
最后,我希望脚本能够得出结论输入是猫还是狗的声音,或两者都不是。
据我所知,需要对声音输入进行预处理(低通;降噪等),然后对声音进行频谱分析,然后将其与数据库中现有的频谱分析进行比较,但我不知道从哪里开始。
感谢您就此事提供任何指导。