我正在为期刊文章标题搜索一些学术搜索门户网站,但是一个特定网站给我提问题而不是希腊字母(α,β,δ),我在使用浏览器(Chrome)时看到了这些字母。
HttpURLConnection connection = (HttpURLConnection) new URL(currentUrl).openConnection();
connection.setRequestProperty("Accept-Charset", "UTF-8");
InputStream response = connection.getInputStream();
BufferedReader reader = new BufferedReader(new InputStreamReader(response, "UTF-8"));
StringBuilder sb = new StringBuilder();
for (String line; (line = reader.readLine()) != null;) {
sb.append(line);
}
在该代码之后我搜索并获取标题,但是一旦调用reader.readLine(),所有希腊字母都是问号。该网站声称使用UTF-8,我在我的InputStreamReader中尝试了它和各种其他字符集。使用ISO-8859-x编码,我得到“Δ和“??”对于其他人(对于US-ASCII也是如此)。