从语音功能构建二进制字符串表示形式

时间:2019-03-19 16:47:50

标签: encoding mfcc quantization

我尝试将我的语音样本转换为二进制字符串以在模糊提取器中使用它。这种方法来自本文:http://www.cs.bu.edu/~reyzin/papers/fuzzy.pdf

希望我能正确理解模糊提取器的概念。我认为论文说的是,我已经从一些生物识别数据中构建了一个二进制字符串,然后将其输入到模糊提取器中。

这是问题所在:我不知道如何获取此二进制字符串。我已经进行了数小时的研究,发现了一些信息,但是我无法理解整个过程。我知道的步骤是:

  1. 从语音中提取特征。 (我决定使用MFCC功能。)
  2. 量化特征,以将连续特征映射为离散特征。
  3. 将离散特征编码为二进制字符串。

第一点没问题。对于第二篇文章,我发现了一些信息,但是我不确定如何实现它,或者不确定是否在python中实现。对于第三个,我没有任何线索。我通读了许多不同作者的论文,但是找不到关于此步骤的可理解的描述。

如果需要,我可以提供更多文献的链接,但我不知道它们是否对解决问题有用

0 个答案:

没有答案