我在Android上使用Google Speech API在我的Android应用中启用语音转文字。但是,我注意到与Google智能助理或内置的“嘿嘿谷歌”相比,识别率要差得多。服务。
那些使用其他API的人是否是同一个API,这可能是质量差异太大的原因。
举个例子,当我说" Smitten Ice Cream" (加利福尼亚州SF的一个地方),谷歌地图立刻理解了演讲,而我的应用程序在5次尝试后没有理解。有没有办法在我尝试转录位置的Speech API中添加上下文?
答案 0 :(得分:3)
这个答案基于一个假设,即使用内置Google SpeechRecognizer多年来为我的applications。
我有很多很多报告称,当用户第一次开始使用我的应用程序时,语音识别远不如Google Now / Assistant所使用的那么准确 - 即使它看起来是相同的“服务”他们的设备。
假设是,当您将package name放入Intent详细信息时:
intent.putExtra(RecognizerIntent.EXTRA_CALLING_PACKAGE, getPackageName());
Google将为此软件包启动一个新的“语音模型”,除非已经存在。正如文档中所述,如果您忽略这一点 - Google可能无论如何都会添加此内容。
这实际上是一种明智的做法。如果您的申请专注于医学术语,您不希望结果偏向于这些术语 - 任何现有模型,很可能是这样。
我发现在短时间内使用后,准确度会大大提高。
由于长期存在的错误,还有另一个潜在的问题 - 如果识别结果仍然存在,您需要卸载提供RecognitionService的Google App,删除所有文件等并重新安装。对于那些精确度非常糟糕的人来说,这是一个即时修复。
与我的内容非常相似的段落出现在我的应用排查部分中,以尝试帮助用户了解。我没有一种识别准确度没有提高的情况。
不是您的解决方案,但我希望确认您的经验会有所帮助。