Java,HttpURLConnection不读波兰语字母

时间:2013-10-08 19:37:58

标签: java url utf-8 httpurlconnection

我希望通过使用HttpURLConnection打开连接,从网站上获取使用波兰字母(例如ś,ć,ę等)的内容。我将InputStreamReader设置为UTF-8,但这没有帮助。

这是我的班级负责连接:

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;

/*
 * To change this template, choose Tools | Templates
 * and open the template in the editor.
 */
public class MyConnection {

URL url;
HttpURLConnection conn;

public MyConnection()
{
}
public void setConnection(URL url)
{
    this.url = url;
}
public void connect() throws IOException {
    conn = (HttpURLConnection) url.openConnection();
}

public String getContent() throws IOException
{
    String data = "";
    String tmp;
    BufferedReader rd = new BufferedReader(new InputStreamReader(conn
            .getInputStream(), "UTF-8"));
    while ((tmp = rd.readLine()) != null) {
        data += tmp + "\n";
    }
    rd.close();
    return data;
}
}

在网站上就是这样:

270 Słabowski
270 Skubiszyński
270 Orzyłowski
270 Mołdrzyk
270 Łagodzki
270 Lęcznar

但我的应用程序就是这样读的:

Skubiszy�ski
Orzy�owski
Mo�drzyk
�agodzki
L�cznar

是正方形(但此处未显示)

conn.getContentEncoding()返回null

在文件中,它看起来像在控制台中一样

您能否告诉我如何更改我的代码以使其正常工作?

0 个答案:

没有答案