Question

我在Android上使用Google Speech API在我的Android应用中启用语音转文字。但是，我注意到与Google智能助理或内置的“嘿嘿谷歌”相比，识别率要差得多。服务。

那些使用其他API的人是否是同一个API，这可能是质量差异太大的原因。

举个例子，当我说＆＃34; Smitten Ice Cream＆＃34; （加利福尼亚州SF的一个地方），谷歌地图立刻理解了演讲，而我的应用程序在5次尝试后没有理解。有没有办法在我尝试转录位置的Speech API中添加上下文？

Answer 1

这个答案基于一个假设，即使用内置Google SpeechRecognizer多年来为我的applications。

我有很多很多报告称，当用户第一次开始使用我的应用程序时，语音识别远不如Google Now / Assistant所使用的那么准确 - 即使它看起来是相同的“服务”他们的设备。

假设是，当您将package name放入Intent详细信息时：

intent.putExtra(RecognizerIntent.EXTRA_CALLING_PACKAGE, getPackageName());

Google将为此软件包启动一个新的“语音模型”，除非已经存在。正如文档中所述，如果您忽略这一点 - Google可能无论如何都会添加此内容。

这实际上是一种明智的做法。如果您的申请专注于医学术语，您不希望结果偏向于这些术语 - 任何现有模型，很可能是这样。

我发现在短时间内使用后，准确度会大大提高。

由于长期存在的错误，还有另一个潜在的问题 - 如果识别结果仍然存在，您需要卸载提供RecognitionService的Google App，删除所有文件等并重新安装。对于那些精确度非常糟糕的人来说，这是一个即时修复。

与我的内容非常相似的段落出现在我的应用排查部分中，以尝试帮助用户了解。我没有一种识别准确度没有提高的情况。

不是您的解决方案，但我希望确认您的经验会有所帮助。