我想使用 JSOUP 库找到网页http://abc.ac.sk
的所有URL。但是有很多具有相同域的子链接。作为示例,该库的网页是http://lib.abc.ac.sk
。在该页面内,存储了一些子URL,如下所示。
<ul class="ddmenu">
<li class="dropdown" ><a href="#" class="dropdown-toggle">About Us</a>
<ul class="dropdown-menu">
<li><a href="aboutus/vission_mission.php?about">Vision & Mission</a></li>
<li><a href="aboutus/librarians_message.php?about">Librarian's Message</a></li>
</ul>
</li>
</ul>
#包含一个链接为http://lib.abc.ac.sk
。我想将 Vision and Mission 页面的完整URL创建为http://lib.abc.ac.sk/aboutus/vission_mission.php?about
。
我尝试将基本URL = http://abc.ac.sk
与子URL aboutus/vission_mission.php?about
合并,如下所示。
public String FixURL(String BaseURL, String Link) {
final String protocol = "http";
String fullURL;
if (!Link.toLowerCase().startsWith(protocol)) {
fullURL = BaseURL + Link;
} else {
fullURL = Link;
}
return fullURL;
}
但这会导致错误的结果为http://abc.ac.sk/aboutus/vission_mission.php?about
。
我想根据域的更改来更改基本URL。但是我不知道如何查找URL的特定更改。伙计们,我想您可以理解这种情况。有什么办法解决此问题。谢谢!