我已经使用HTK(隐藏马尔可夫模型工具包)来识别特定命令 用于控制我的Android应用程序,但在这种情况下,我需要将一些语音数据传递给服务器,这可能会消耗更多的时间。
为了防止这种延迟,我正在考虑使用pocketsphinx在本地识别Android应用程序的语音数据,以便我不需要将该音频传递给服务器。
如果这是一个好主意,从头开始学习口袋妖怪是否容易?此外,这两种技术(基于服务器和本地语音识别)的优点和缺点是什么,哪一种更好?
答案 0 :(得分:0)
CMUSphinx绝对是一个好主意,它比HTK有许多优势:
你一定要尝试Pocketsphinx,有关更多信息,请参阅
http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/