通过Bing语音识别API(beta)获取相同音频文件(.wav)的不同结果

时间:2016-09-05 07:22:02

标签: c# speech-recognition microsoft-cognitive

我们正在翻译一堆音频文件(即.wav文件),我们在不同的系统上获得了不同的结果。我们收到的唯一区别是数字转换被翻译成单词,但我们只需要翻译文本中的数字。

例如:我们有波形文件,即A-Hydrocort_50_mg-ml.wav

系统1上的转录文字:水上法院每毫升50毫克。

系统2上的转录文字:水上法院每毫升50毫克。

我们使用相同的API调用只有2个不同的机器,API本身给我们不同的响应,请求完全相同(只为每个请求生成新的GUID)。

这是一段代码:

        string url = "https://speech.platform.bing.com/recognize";

        string requestUri = url.Trim(new char[] { '/', '?' });

        /* URI Params. Refer to the README file for more information. */
        requestUri += @"?scenarios=smd";                                  // websearch is the other main option.//ulm//catsearch//websearch
        requestUri += @"&appid=D4D52672-91D7-4C74-8AD8-42B1D98141A5";     // You must use this ID.
        requestUri += @"&locale=en-US";                                   // We support several other languages.  Refer to README file.
        requestUri += @"&device.os=Windows OS";
        requestUri += @"&version=3.0";
        requestUri += @"&format=json";
        requestUri += @"&instanceid=565D69FF-E928-4B7E-87DA-9A750B96D9E3";
        requestUri += @"&requestid=" + Guid.NewGuid().ToString();

        string host = @"speech.platform.bing.com";
        //For wave files
        string contentType = @"audio/wav; codec=audio/pcm; samplerate=16000";

0 个答案:

没有答案