使用Jsoup时根据页面URL修改子URL

时间:2019-04-04 11:20:31

标签: java jsoup

我想使用 JSOUP 库找到网页http://abc.ac.sk的所有URL。但是有很多具有相同域的子链接。作为示例,该库的网页是http://lib.abc.ac.sk。在该页面内,存储了一些子URL,如下所示。

<ul class="ddmenu">
  <li class="dropdown"  ><a href="#" class="dropdown-toggle">About Us</a>
     <ul class="dropdown-menu">
       <li><a href="aboutus/vission_mission.php?about">Vision & Mission</a></li>
       <li><a href="aboutus/librarians_message.php?about">Librarian's Message</a></li>
     </ul>
  </li>
</ul>   

包含一个链接为http://lib.abc.ac.sk。我想将 Vision and Mission 页面的完整URL创建为http://lib.abc.ac.sk/aboutus/vission_mission.php?about

我尝试将基本URL = http://abc.ac.sk与子URL aboutus/vission_mission.php?about合并,如下所示。

public String FixURL(String BaseURL, String Link) {
    final String protocol = "http";
    String fullURL;
    if (!Link.toLowerCase().startsWith(protocol)) {
        fullURL = BaseURL + Link;
    } else {
        fullURL = Link;
    }
    return fullURL;
}

但这会导致错误的结果为http://abc.ac.sk/aboutus/vission_mission.php?about。 我想根据域的更改来更改基本URL。但是我不知道如何查找URL的特定更改。伙计们,我想您可以理解这种情况。有什么办法解决此问题。谢谢!

0 个答案:

没有答案