在Java中解析URL字符串

时间:2014-07-16 11:49:17

标签: java jsoup

在Java中,如何解析Google URL字符串以检索基本URL?

例如,来自:

https://www.google.co.in/url?q=http://www.yellowpagesgoesgreen.org/Concord-CA/Arthritis%2BSpecialists&sa=U&ei=RGbGU7TsIdORuATUx4GwCA&ved=0CDsQFjAH&usg=AFQjCNEE-p8ESL0Dxhknnhw1Tk9kpwvFGw.

为:

http://www.yellowpagesgoesgreen.org/Concord-CA/Arthritis+Specialists

2 个答案:

答案 0 :(得分:1)

从你问的问题的方式不确定你是否会得到这个,尝试这样的东西,只需要解析它。一段时间没有编写java可能包含语法错误,需要根据您的要求进行编辑。

 public String findURL(String googleURL) 
 {
        String [] first = googleURL.split("url?q=");
        String[] final = method[1].split("sa=");
        url = final[0];
        url = url.replace("%2B", "+");
        return url
 }

答案 1 :(得分:1)

我建议在隔离字符串之后进行URL解码:

public String unGoogle(String googled) {
    int start = googled.indexOf("url?q=");
    int end = googled.indexOf("&", start);
    return URLDecoder.decode(googled.substring(start, end));
}

您可以添加错误检测,以避免在end失败时查找start,以便更好地包装异常。