训练文件language_id.txt for Google Prediction API无法使用

时间:2014-07-31 20:29:52

标签: utf-8 google-api google-prediction

我关注 Google Prediction API Hello Prediction example

不幸的是,培训文件language_id.txt似乎以某种方式被破坏了?我测试了使用谷歌浏览器和Firefox下载它,结果相同,请参见截图:

enter image description here

我认为,因此我的测试不起作用,我总是以English 1.0示例字符串的分数取回Muy Bueno

  ...
  {
   "label": "English",
   "score": "1.000000"
  },
  ...

我从哪里可以获得有用的language_id.txt测试文件,或者我还能做些什么吗?

编辑:我的猜测是,该文件尚未以UTF-8格式存储在Google服务器上?

1 个答案:

答案 0 :(得分:2)

该文件是UTF-8,但它没有声明编码,因此在浏览器中查看它会采用默认的HTTP字符集ISO-8859-1。

我不确定为什么你实际上会收到一个损坏的副本(如果我在Chrome中查看它,它看起来已损坏,但保存它会产生正确的UTF-8编码文件),但也许你可以试试另一个机制下载吗?