使用pocketsphinx解码8位wav文件

时间:2013-10-15 10:04:31

标签: audio speech-recognition cmusphinx

我正在尝试将我的电话应用程序与口袋狮身人面像语音识别器集成。我得到的录制文件类型是以下类型:

Input File     : '5555_9911848379__15-10-14-17-36_.wav'
Channels       : 1
Sample Rate    : 11025
Precision      : 8-bit
Duration       : 00:00:03.99 = 44000 samples ~ 299.32 CDDA sectors
File Size      : 44.0k
Bit Rate       : 88.3k
Sample Encoding: 8-bit Unsigned Integer PCM

但是,这里给出的示例程序http://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx 期望16位PCM音频以16000 HZ采样。

有什么办法可以解码上面提到的录音文件。或者我必须将上述格式转换为16位格式吗?

1 个答案:

答案 0 :(得分:0)

  

有什么方法可以解码上面提到的录音文件。

不,你需要16位

  

或者我必须将上述格式转换为16位格式吗?

转换无效,因为信息已经丢失。你需要16位录音。

您需要确保以正确的格式录制音频。