我关注 Google Prediction API 的Hello Prediction example。
不幸的是,培训文件language_id.txt似乎以某种方式被破坏了?我测试了使用谷歌浏览器和Firefox下载它,结果相同,请参见截图:
我认为,因此我的测试不起作用,我总是以English 1.0
示例字符串的分数取回Muy Bueno
。
...
{
"label": "English",
"score": "1.000000"
},
...
我从哪里可以获得有用的language_id.txt测试文件,或者我还能做些什么吗?
编辑:我的猜测是,该文件尚未以UTF-8格式存储在Google服务器上?
答案 0 :(得分:2)
该文件是UTF-8,但它没有声明编码,因此在浏览器中查看它会采用默认的HTTP字符集ISO-8859-1。
我不确定为什么你实际上会收到一个损坏的副本(如果我在Chrome中查看它,它看起来已损坏,但保存它会产生正确的UTF-8编码文件),但也许你可以试试另一个机制下载吗?