Question

我关注 Google Prediction API 的Hello Prediction example。

不幸的是，培训文件language_id.txt似乎以某种方式被破坏了？我测试了使用谷歌浏览器和Firefox下载它，结果相同，请参见截图：

enter image description here

我认为，因此我的测试不起作用，我总是以English 1.0示例字符串的分数取回Muy Bueno。

  ...
  {
   "label": "English",
   "score": "1.000000"
  },
  ...

我从哪里可以获得有用的language_id.txt测试文件，或者我还能做些什么吗？

编辑：我的猜测是，该文件尚未以UTF-8格式存储在Google服务器上？

Answer 1

该文件是UTF-8，但它没有声明编码，因此在浏览器中查看它会采用默认的HTTP字符集ISO-8859-1。

我不确定为什么你实际上会收到一个损坏的副本（如果我在Chrome中查看它，它看起来已损坏，但保存它会产生正确的UTF-8编码文件），但也许你可以试试另一个机制下载吗？