在iOS或Android智能手机上,仅需一个单词的语音识别就可以降低任务的复杂性,从而足以完全执行离线的语音识别处理吗? (例如,是否可以开发出一种合理准确的计数器来计算麦克风处于活动状态时说出一个预先编程的单词的次数,从而可以在标准的iOS或Android智能手机上离线工作?)。
我已经找到了很多工具和示例来捕获语音并将其发送到在线服务(例如Google云语音到文本),但是单字集中可以降低识别的复杂度吗?今天可以离线吗?如果是这样,您有任何建议的图书馆吗?或者从哪里开始?
答案 0 :(得分:-1)
由于与您的问题有关的各种原因,云服务很好:
除上述内容外,我认为单字焦点不会发生太大变化(如果有的话)。该模型不仅要考虑单词,还要说明这些单词的不同表达方式(音量,语调,重音,变调等)。
所以您要执行的操作 可以完成,但也有充分的理由将其存储在云中。