没有互联网的iPhone中的大词汇量语音识别?

时间:2011-07-21 04:38:10

标签: iphone ipad speech-recognition speech-to-text openears

我使用需要字典的Openears。当我们在字典中提到这个词时,这很有用。我想转换我们说的所有单词。所以我使用Nuance的演讲来识别dragaon SDK。但它与网络服务器通信。出于安全考虑,我想避免服务器通信。是否可以将语音转换为文本,因为我们在Windows Mobile中所说的所有单词都没有仅在离线模式下与服务器通信?

3 个答案:

答案 0 :(得分:3)

具有无限词汇量的语音识别需要非常大的计算和内存资源(千兆字节的内存),因此在其他嵌入式设备上使用iPhone非常困难。 iPhone比桌面慢9倍。 iPad更容易,因为它具有更强大的CPU。

谷歌已经付出了很大的努力让他们的引擎脱机进行听写,但它仍然更喜欢将数据发送到服务器,因为它更加准确。

因此,在小型设备上运行的大多数解决方案都使用有限的词汇表。虽然这个词汇量足够大,但你不会注意到这一点。通常500-1000字足以涵盖大多数实际情况。您可以使用OpenEars来识别这样的词汇。

要训练语言模型,您需要来自您的域的文本(单词和表达)。语言模型培训在CMUSphinx tutorial中描述。要使用语言模型,您可以使用以下OpenEars API调用:

- (void) changeLanguageModelToFile:     (NSString *)    languageModelPathAsString
withDictionary:     (NSString *)    dictionaryPathAsString 

有关详细信息,请参阅API reference

您可以使用具有此类词汇表和相应语言模型的OpenEars来支持设备的自由格式文本输入。

答案 1 :(得分:1)

可以这样做,但是如果你正在寻找一个无限的词汇量语音到文本转换器,那么最好是在服务器上完成计算。对于智能手机等系统来说,这种系统的要求可能太高了。您将有很多要求的主要领域如下:

  1. 将输入语音映射到文本的字典。
  2. 运行语音识别算法的计算。
  3. 我认为这就是像谷歌这样的公司通过服务器而不是手机运行语音识别服务的原因。

    但如果应用程序是一个有限的单词语音文本,那么它可能值得尝试一下。

    一切顺利!

答案 2 :(得分:0)

没有网络连接,pocketsphinx不能在iPhone上运行吗?是不是有像VocalKit

那样的一些演示应用程序

http://www.rajeevan.co.uk/pocketsphinx_in_iphone/可能会有所帮助。