我使用为IBM Watson服务提供的Unity SDK。我尝试使用' ExampleStreaming.cs'样本用于语音识别。我在统一编辑器中测试应用程序。
此示例使用麦克风作为音频输入,并从用户获取语音输入的结果。但是,当我使用麦克风作为输入时,转录的结果远非正确。当我说"创建一个黑盒"时,结果是不合适的,结果一词与输入完全无关。
当我使用预先录制的语音剪辑时,输出非常完美。 该服务的印度口音是否表现不正确? 麦克风输入识别不良的原因是什么?
文档说: "通常,该服务对背景噪声敏感。例如,发动机噪音,工作装置,街道噪音和谈话会显着降低准确性。此外,通常安装在移动设备和平板电脑上的麦克风通常不足。当专业麦克风用于捕获质量更好的音频时,该服务表现最佳。"
我使用罗技耳机麦克风作为输入源。
答案 0 :(得分:0)
萨蒂什南比亚,
尝试尽可能“清理”音频 - 限制背景噪音。另请注意,您可以使用两种不同的处理模型之一 - 一种用于宽带,一种用于窄带。尝试两者,看看哪种最适合您的输入设备。
此外,您可以发现基础语音模型不能处理您可能正在寻找的所有特定于域的术语。在这些情况下,您可以自定义和扩展语音模型,如使用Custom Language Models(https://console.bluemix.net/docs/services/speech-to-text/custom.html#custom)的文档中所述。虽然这涉及更多,但它通常会在准确性和整体可用性方面产生巨大差异。