我一直在研究几个iOS语音识别框架,并且发现很难完成我认为非常简单的事情。
我有一个应用程序,允许人们录制他们的声音。录制完成后,他们可以选择创建文本版本。
查看那里的服务(即Nuance),大多数都要求您使用麦克风。 OpenEars允许你这样做,但字典是如此有限,因为它是一个离线解决方案(他们建议300或更少的单词)。
应用程序还有一些其他的事情会使得从当前的录制方法切换起来非常缺乏吸引力。对于它的价值,我正在使用Amazing Audio Engine框架。
任何人对框架都有任何其他建议。或者有没有办法深入挖掘Nuance来录制录制的文件?
感谢您的时间。
答案 0 :(得分:1)
对于服务,您可以使用一些基于云的托管语音识别服务。您只需将音频文件发布到其URL并接收文本即可。他们中的大多数人对词汇没有任何限制。您当然可以选择任何您喜欢的录音方式。
见这里:Server-side Voice Recognition。他们中的许多人也提供免费试用。