java net URLDecoder解码解码不起作用

时间:2014-10-14 12:23:54

标签: java uri jsoup decoding text-decoding

我首先尝试通过应用下面的脚本获取网页中的所有链接:然后我想再次使用这些链接。但由于解码并不总是有效,这导致链接不正确,我收到404错误。

Document doc = Jsoup.connect(doi_con).ignoreContentType(true).get();

Elements links = doc.select("a[href]");

for (Element link : links) {
    String url = link.absUrl("href");

    //byte[] decodeds1= DatatypeConverter.parseBase64Binary(url);
    //dec_url = DatatypeConverter.printBase64Binary(decodeds1);

    dec_url = java.net.URLDecoder.decode(url, "UTF-8");
}

在此代码中,解码部分似乎适用于某些网址。我得到的样本如下:

http://link.springer.com/signup-login?previousUrl=/article/10.1007%2Fs10899-005-5558-2
http://link.springer.com/article/10.1007/s10899-005-5558-2#kb-nav--main

正如第一个链接所见,解码不起作用,而后来它起作用。

我缺少什么?我也尝试过parseBase64Binary和printBase64Binary,如上面的代码所示,但它再次没有用。

提前致谢!

0 个答案:

没有答案