认知服务演讲文本JS websocket连接问题

时间:2018-06-08 17:00:11

标签: microsoft-cognitive bing-speech

我们正在实施基于JavaScript SDK库(https://github.com/Azure-Samples/SpeechToText-WebSockets-Javascript)的服务。我们遇到了一些承认问题。

基于支持的音频文件格式(https://docs.microsoft.com/en-us/azure/cognitive-services/speech/getstarted/getstartedcsharpservicelibrary#supported-audio-formats),编解码器和持续时间,我们准备了OPUS格式的音频样本文件,因为它具有最佳大小文件的良好质量。这些文件的持续时间小于最大值,可通过Bing Speech API(https://docs.microsoft.com/en-us/azure/cognitive-services/speech/api-reference-rest/websocketprotocol)识别 - 10分钟。

案件的初始要求:

文件格式 - OPUS

音频长度 - 9分钟(540秒)

文件大小 - 7.1 Mb

第一期:

有时Bing语音服务仅识别音频的前约2:30分钟,并发送关于完成识别过程的事件(RecognitionEndedEvent)。

第二期:

未收到关于完成识别过程的事件。识别的所有部分都被成功接收,似乎整个音频都被识别,但我们无法确保在收到最终事件(RecognitionEndedEvent)之前完成该过程。

您能帮我们理解为什么会出现这些问题以及我们如何防止这些问题发生?

0 个答案:

没有答案