声学模型小时数

时间:2014-10-04 15:21:24

标签: cmusphinx pocketsphinx-android

我想创建一个识别阿拉伯字母的模型。我知道如何创建语言模型和字典文件,但我被困在声学模型中。我为每个字母记录了wav文件,但在培训期间,它表示尽管培训仍在继续,但培训时间太短。当我尝试使用它时,模型不识别任何东西(给出null)。

我想知道如何记录wav文件,如果我在一个wav文件中继续重复,例如,字母 Alif 100次,或者我应该只记录多个wav文件同一封信。

非常感谢您的帮助。

1 个答案:

答案 0 :(得分:1)

  

我想知道如何记录wav文件,我应该继续重复,例如,在一个wav文件中使用Alif字母100次,或者我应该只记录多个相同字母的wav文件。

最好让多个文件包含连续词,而不是字母。信件很难识别。

  

当我尝试使用它时,模型不会识别任何内容(给出null)。

这里可能存在不同的问题(错误的音频格式等)。您可以使用dropbox在CMUSphinx论坛上共享数据库,以获得有关此问题的帮助。