Bluemix语言标识不识别英语

时间:2016-04-17 21:50:34

标签: ibm-cloud ibm-watson

所以我正在测试语言翻译 - 识别API,这很奇怪 - 它很好地识别西班牙语,但不是英语。咦?看看这个......

转到https://watson-api-explorer.mybluemix.net/apis/language-translation-v2#!/identify/identifyLanguageGet

将此文本粘贴到框中:

迈克尔是+ A +硬盘+工作+学生+在+他+日报+任务谁+表演+责任+。+他是+热情%2C +经营+在+他+学习%+主动+ 2C +所有+品质+通过+参与+ +他+等级+和+能力+到+自我评估+他+工作+他+拥有+成为+非常+好+在+确定+他+长处显示+ +和+使用+反馈到+ + +改进和修改+ + +他的任务。+恭喜+上+ A +极大+第一+学期。

我回来了#34; et"这是爱沙尼亚人。咦?

如果我输入此文本(与之前相同,但最后还有一个字符):

迈克尔是+ A +硬盘+工作+学生+在+他+日报+任务谁+表演+责任+。+他是+热情%2C +经营+在+他+学习%+主动+ 2C +所有+品质+通过+参与+ +他+等级+和+能力+到+自我评估+他+工作+他+拥有+成为+非常+好+在+确定+他+长处显示+ +和+使用+反馈到+ + +改进和修改+ + +他的任务。+恭喜+上+ A +极大+第一+学期。%21

我得到" ja"这是日本人。我也得到了#34; ht"这是HAITIAN CREOLE不时....你好Watson?英国??

1 个答案:

答案 0 :(得分:0)

绝对是编码问题。正如文档所说,一切都必须严格按照UTF-8标准。

FYI在POST请求中,即使您确实需要对文本进行编码,文本也必须严格按UTF-8格式。这是我面临的挑战之一,因为很明显,您正在使用语言翻译处理许多重音字符。