我目前正在使用为Java提供的Jaunt api从网站检索超链接。代码如下:
for (Element link : UA.doc.findEvery("<h3 class=r>").findEvery("<a>")) {
String temp = link.getAt("href");
System.out.println(temp);
}
问题是当我访问下面的网站并将其打印到控制台时?和=符号我转换为%3F和%3D。
https://www.bloomberg.com/research/stocks/private/snapshot.asp?privcapId=7991464
对不起,如果问题是基本的,但我无法在网上找到有关此问题的任何内容。你们认为它可能是编码问题吗?总结一下,如果可能,我想将%3F和%3D转换为原始形式。
如果您需要更多信息,请与我们联系。
答案 0 :(得分:1)
我们可以关闭这个话题。当我使用下面的代码时它起作用了:
System.out.println(URLDecoder.decode(link.getAt("href"), "UTF-8"));