Jsoup,忽略与javascript弹出窗口<a href="javascript:OpenPopup()"></a>的链接

时间:2012-05-22 14:13:39

标签: java jsoup

我正在使用jsoup来解析链接的某些页面,然后使用httpclient来测试链接以查看它们是否正常工作。我页面上的一些链接是,我想忽略这些。

当我的代码尝试从中获取链接时,返回空白。我可以从我的支票中排除所有空白,但有时可能会在我的网站上创建的链接是空白的(偶然),我想要抓住,以便我可以解决。

所以我想要做的是能够识别链接何时是一个javascript弹出窗口,所以我可以忽略这个特定链接上的链接测试。我解析链接的代码如下:

private void setLinks(){
    String link;
    try {
        Document doc = response.parse();

        Elements element = doc.select(htmlElementTarget+" a[href]");
        for (Element page : element){
            link = page.absUrl("href");
            if (validateUrl(link)){
                linksText.add(page.text());
                links.add(link);
            }
        }
    } catch (IOException e) {
        System.out.println(e);
    }
}

欢迎任何其他关于我的代码的批评

1 个答案:

答案 0 :(得分:1)

如果href始终为javascript:OpenPopup(),则可以添加另一个if语句。

if (page.attr("href").equals("javascript:OpenPopup()")) {
    if (validateUrl(link) {
    }
}

注意...代码未经过编译测试。