我正在使用jsoup来解析链接的某些页面,然后使用httpclient来测试链接以查看它们是否正常工作。我页面上的一些链接是,我想忽略这些。
当我的代码尝试从中获取链接时,返回空白。我可以从我的支票中排除所有空白,但有时可能会在我的网站上创建的链接是空白的(偶然),我想要抓住,以便我可以解决。
所以我想要做的是能够识别链接何时是一个javascript弹出窗口,所以我可以忽略这个特定链接上的链接测试。我解析链接的代码如下:
private void setLinks(){
String link;
try {
Document doc = response.parse();
Elements element = doc.select(htmlElementTarget+" a[href]");
for (Element page : element){
link = page.absUrl("href");
if (validateUrl(link)){
linksText.add(page.text());
links.add(link);
}
}
} catch (IOException e) {
System.out.println(e);
}
}
欢迎任何其他关于我的代码的批评
答案 0 :(得分:1)
如果href
始终为javascript:OpenPopup()
,则可以添加另一个if语句。
if (page.attr("href").equals("javascript:OpenPopup()")) {
if (validateUrl(link) {
}
}
注意...代码未经过编译测试。