标签: signal-processing speech-recognition
我想实现一个应用程序,其中给定包含语音作为查询的音频,它返回已由其他用户提交的最相似的音频。
如果两个音频包含大致相同的单词集,则这两个音频类似。
例如,如果查询语音是“Hello World!”:
请注意,这个“音频检测器”必须能够抵抗不同的木材(不同的用户声音)。如果它能够抵抗噪音(如合理的室外噪音)和旋律失真(比如匹配“Hello World!”和“Hellooo World!”),那将会很酷。