我们正在翻译一堆音频文件(即.wav文件),我们在不同的系统上获得了不同的结果。我们收到的唯一区别是数字转换被翻译成单词,但我们只需要翻译文本中的数字。
例如:我们有波形文件,即A-Hydrocort_50_mg-ml.wav
系统1上的转录文字:水上法院每毫升50毫克。
系统2上的转录文字:水上法院每毫升50毫克。
我们使用相同的API调用只有2个不同的机器,API本身给我们不同的响应,请求完全相同(只为每个请求生成新的GUID)。
这是一段代码:
string url = "https://speech.platform.bing.com/recognize";
string requestUri = url.Trim(new char[] { '/', '?' });
/* URI Params. Refer to the README file for more information. */
requestUri += @"?scenarios=smd"; // websearch is the other main option.//ulm//catsearch//websearch
requestUri += @"&appid=D4D52672-91D7-4C74-8AD8-42B1D98141A5"; // You must use this ID.
requestUri += @"&locale=en-US"; // We support several other languages. Refer to README file.
requestUri += @"&device.os=Windows OS";
requestUri += @"&version=3.0";
requestUri += @"&format=json";
requestUri += @"&instanceid=565D69FF-E928-4B7E-87DA-9A750B96D9E3";
requestUri += @"&requestid=" + Guid.NewGuid().ToString();
string host = @"speech.platform.bing.com";
//For wave files
string contentType = @"audio/wav; codec=audio/pcm; samplerate=16000";