如何使用python找到两个语音文件的差异

时间:2013-07-07 10:37:25

标签: algorithm speech-recognition voice voice-recognition voicexml

我想要两个比较两个语音文件并找到它们之间的区别,配偶,我有一个音乐曲目的原始文件和另一个由我读出的音乐文件,我想要两个比较这两个文件并找到差异在他们的音素之间,实际上这些单词对我来说并不重要,重要的是音素的相似性,我想找到类似相似百分比的东西。我更喜欢用Python实现一些东西。

1 个答案:

答案 0 :(得分:9)

您可以在Chromaprint中使用fpcalc尝试音频指纹识别。

Chromaprint是AcoustID项目的核心组成部分。 音频指纹识别是使用Chromaprint中的fpcalc完成的。 fpcalc应该放在与Python脚本相同的目录中。

用于Chromaprint声学指纹识别和Acoustid API的Python绑定。

https://pypi.python.org/pypi/pyacoustid

Bellow是一篇带有python演示代码的示例文章。

使用互相关指纹比较重复内容的非相同音频文件 http://www.randombytes.org/audio_comparison.html

Chromaprint如何运作?

http://oxygene.sk/2011/01/how-does-chromaprint-work/