给出我希望用户(或多或少准确地)阅读的已知手稿(文本),识别用户在手稿中的进度的最佳方法是什么?
在iOS上寻找特定解决方案时,我也对更通用的答案感兴趣。
iOS提供了一个名为Speech的语音识别框架,我可以使用它来识别任何语音。我当前的方法是使用此框架的字符串结果将它们与手稿相匹配。但是,在我看来,这似乎有很多开销,并且当我第一次向语音识别器提供期望的单词时,它将节省资源并提高精度,以便它“知道”要听的内容。
例如,当稿件中的下一个单词是“鱼”时,我不会 需要语音识别器来搜索整个英语 最适合所录制音频的单词词典–仅我 需要获得一个概率值,用户只是 说“鱼”。
我认为它与关键词发现非常相似,只是我不仅发现了一些关键词,而且发现了整个原稿中的单词。
不幸的是,我无法在iOS上找到这样的API。是否有比上述方法更好的方法来实现这种“语音跟踪”?
答案 0 :(得分:1)
但是,在我看来,这似乎有很多开销,并且当我第一次向语音识别器提供期望的单词以使其“知道”要听的内容时,它将节省资源并提高精度。
也许会,但是语音框架无法为您提供这种方式,因此您无法做到。