我希望通过使用HttpURLConnection
打开连接,从网站上获取使用波兰字母(例如ś,ć,ę等)的内容。我将InputStreamReader
设置为UTF-8
,但这没有帮助。
这是我的班级负责连接:
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
/*
* To change this template, choose Tools | Templates
* and open the template in the editor.
*/
public class MyConnection {
URL url;
HttpURLConnection conn;
public MyConnection()
{
}
public void setConnection(URL url)
{
this.url = url;
}
public void connect() throws IOException {
conn = (HttpURLConnection) url.openConnection();
}
public String getContent() throws IOException
{
String data = "";
String tmp;
BufferedReader rd = new BufferedReader(new InputStreamReader(conn
.getInputStream(), "UTF-8"));
while ((tmp = rd.readLine()) != null) {
data += tmp + "\n";
}
rd.close();
return data;
}
}
在网站上就是这样:
270 Słabowski
270 Skubiszyński
270 Orzyłowski
270 Mołdrzyk
270 Łagodzki
270 Lęcznar
但我的应用程序就是这样读的:
Skubiszy�ski
Orzy�owski
Mo�drzyk
�agodzki
L�cznar
�
是正方形(但此处未显示)
conn.getContentEncoding()
返回null
在文件中,它看起来像在控制台中一样
您能否告诉我如何更改我的代码以使其正常工作?