谷歌翻译v2 api返回非UTF-8字符

时间:2011-09-04 23:40:23

标签: java google-app-engine encoding google-translate

我正在尝试在我的应用引擎项目中使用Google Translate v2 api。然而,对于重音字符,它的编码是混乱的[例如“学生”这个词,在法语中应该是“étudiants”,变成“ttudiants”]。这是我的代码。

    URL url = new URL(
            "https://www.googleapis.com/language/translate/v2?key=" + KEY
                    + "&q=" + urlEncodedText + "&source=en&target="
                    + urlEncodedLang);
    try {
        InputStream googleStream = url.openStream();

        // make a new bufferred reader, by reading the page at the URL given
        // above
        BufferedReader reader = new BufferedReader(new InputStreamReader(
                googleStream));

        // temp string that holds text line by line
        String line;

        // read the contents of the reader/the page by line, until there are
        // no lines left
        while ((line = reader.readLine()) != null) {
            // keep adding each line to totalText
            totalText = totalText + line + "\n";
        }
        // remember to always close the reader
        reader.close();

    } catch (Exception ex) {
        ex.printStackTrace();
    }

在浏览器中输入相同的网址(Ubuntu上的Chrome)可以正常工作,并返回包含正确重音字符的JSON响应。

我在这里缺少什么? 感谢

2 个答案:

答案 0 :(得分:1)

要确保它具有UTF-8编码,您必须使用:

BufferedReader reader = new BufferedReader(new InputStreamReader(googleStream, "UTF-8"));

在其他情况下,它使用默认编码,可能是ISO-8859-1

答案 1 :(得分:0)

您也可以尝试使用Google Translate API v2 for Java为您完成此操作。