如何识别包含相同单词集的音频文件?

时间:2016-05-29 11:19:51

标签: signal-processing speech-recognition

我想实现一个应用程序,其中给定包含语音作为查询的音频,它返回已由其他用户提交的最相似的音频。

如果两个音频包含大致相同的单词集,则这两个音频类似。

例如,如果查询语音是“Hello World!”:

  • 它返回“Hello my World!”,“Hello Worlds!”
  • 没有必要返回“Hello Earth”或“Bye world!”
  • 它没有返回“特朗普是一个笨蛋”(即使它是真的,但这是另一个故事:))

请注意,这个“音频检测器”必须能够抵抗不同的木材(不同的用户声音)。如果它能够抵抗噪音(如合理的室外噪音)和旋律失真(比如匹配“Hello World!”和“Hellooo World!”),那将会很酷。

0 个答案:

没有答案