Bing拼写检查API对mode = spell有额外的长度限制吗?

时间:2017-01-10 21:51:52

标签: bing-api microsoft-cognitive

Bing spell check API对请求想要进行拼写检查[mode = spell]或校对读取[mode = proof(默认)]的文本块有10,000个字符限制。

但是我遇到一个问题,其中一大堆拼错文本明显低于10k,在拼写检查请求中没有返回带有标记的标记,但确实返回到校对请求中。

是什么给出的?拼写检查有下限吗?

以下两个请求的输出。我在两种情况下都使用POST,两个响应都返回200 OK

模式:拼写

请求:

  

POST   https://api.cognitive.microsoft.com/bing/v5.0/spellcheck/?mode=spell   HTTP / 1.1内容类型:application / x-www-form-urlencoded主机:   api.cognitive.microsoft.com Ocp-Apim-Subscription-Key:   ••••••••••••••••••••••••••••••••

     

Text =这是一个很长的错误,在这里有一些错误。它的假设   是一个问题,但我想不出一个长问题。也许那个   意味着我没有什么可以问的东西?

响应:

  

变化:接受编码BingAPIs-TraceId:   2802E335D1A04D22865FCA6039E61233 X-MSEdge-ClientID:   3F1CA016365F6B862DF6AA10376E6A50 X-MSAPI-UserState:97c3   BingAPIs-Market:en-US X-MSEdge-Ref:Ref A:   2802E335D1A04D22865FCA6039E61233参考B:   E62A760E2E5891B3D022742C51159258参考C:Tue Jan 10 13:44:58 PST   apim-request-id:7b94e044-d1fe-4bbc-a153-4d4e5ef30586   严格运输安全:max-age = 31536000; includeSubDomains;   preload Cache-Control:max-age = 0,私人日期:星期二,2017年1月10日   21:44:57 GMT P3P:CP =" NON UNI COM NAV STA LOC CURa DEVa PSAa PSDa我们的   IND"内容长度:44内容类型:application / json;字符集= utf-8的   到期日:2017年1月10日星期二21:43:57 GMT

     

{" _type":" SpellCheck"," flaggedTokens":[]}

模式:证明

请求:

  

POST   https://api.cognitive.microsoft.com/bing/v5.0/spellcheck/?mode=proof   HTTP / 1.1内容类型:application / x-www-form-urlencoded主机:   api.cognitive.microsoft.com Ocp-Apim-Subscription-Key:   ••••••••••••••••••••••••••••••••

     

Text =这是一个很长的错误,在这里有一些错误。它的假设   是一个问题,但我想不出一个长问题。也许那个   意味着我没有什么可以问的东西?

响应:

  

变化:接受编码BingAPIs-TraceId:   627B24C4E6D148E1B441F29A4872942B X-MSEdge-ClientID:   33F31CBFF80462EB27B316B9F935630A X-MSAPI-UserState:983f   BingAPIs-Market:en-US X-MSEdge-Ref:Ref A:   627B24C4E6D148E1B441F29A4872942B参考B:   79AB388A3DFCBD481B71DB909B097DC3参考C:Tue Jan 10 13:46:16 PST   apim-request-id:645f3de5-6823-40d1-aea6-312e10d1eee2   严格运输安全:max-age = 31536000; includeSubDomains;   preload Cache-Control:max-age = 0,私人日期:星期二,2017年1月10日   21:46:16 GMT P3P:CP =" NON UNI COM NAV STA LOC CURa DEVa PSAa PSDa我们的   IND" Content-Length:700 Content-Type:application / json;字符集= utf-8的   到期日:2017年1月10日星期二21:45:16 GMT

     

{

     

" _type":" SpellCheck",

     

" flaggedTokens":[

{

  "offset": 15,

  "token": "sentance",

  "type": "UnknownToken",

  "suggestions": [

    {

      "suggestion": "sentence",

      "score": 0.687877624668787

    }

  ]

},

{

  "offset": 86,

  "token": "i",

  "type": "UnknownToken",

  "suggestions": [

    {

      "suggestion": "I",

      "score": 0

    }

  ]

},

{

  "offset": 137,

  "token": "i",

  "type": "UnknownToken",

  "suggestions": [

    {

      "suggestion": "I",

      "score": 0

    }

  ]

},

{

  "offset": 52,

  "token": "its",

  "type": "UnknownToken",

  "suggestions": [

    {

      "suggestion": "it's",

      "score": 0.830337199488689

    }

  ]

},

{

  "offset": 160,

  "token": "selious",

  "type": "UnknownToken",

  "suggestions": [

    {

      "suggestion": "serious",

      "score": 0.897224156828521

    },

    {

      "suggestion": "delicious",

      "score": 0.687622047694618

    }

  ]

}
     

     

}

1 个答案:

答案 0 :(得分:2)

这是Bing的API的不同来源,但可能是事实的来源: https://dev.cognitive.microsoft.com/docs/services/56e73033cf5ff80c2008c679/operations/56e73036cf5ff81048ee6727

  

拼写 - 意味着提供拼写更正等搜索引擎。它   将纠正小查询(最多9个令牌),没有任何外壳   更改并将更加优化(性能和相关性)以进行搜索   喜欢查询。