使用汉字从URL获取图像

时间:2018-01-02 15:05:25

标签: java url character-encoding internationalization

我想从远程网址获取图片。

String url =  "http://見.香港/images/wonton.jpg";
String url2 = IDN.toUnicode(url);
BufferedImage bi = ImageIO.read(new URL(url2));
System.out.println(bi);

此代码始终以

失败
  

javax.imageio.IIOException:无法从URL获取输入流!
  引起:java.net.UnknownHostException:见。香港

我做错了什么?

1 个答案:

答案 0 :(得分:5)

仅对网址的主机部分进行编码,并确保使用IDN.toASCII()而不是IDN.toUnicode()

String fullUrl = "http://見.香港/images/wonton.jpg";
URL url = new URL(fullUrl);

url.getProtocol(); // "http"
url.getHost(); // "見.香港"
url.getPath(); // "/images/wonton.jpg"

String asciiHost = IDN.toASCII(url.getHost());
String validUrl = url.getProtocol() + "://" + asciiHost + url.getPath();
System.out.println(validUrl);
BufferedImage bi = ImageIO.read(new URL(validUrl));

控制台输出: http://xn--nw2a.xn--j6w193g/images/wonton.jpg

请注意,如果要包含空格等字符,则可能需要URLEncode URI的资源部分。