使用JSoup解析文档并删除具有特定ID和类的div

时间:2015-09-11 22:21:11

标签: java jsoup

即使它很简单,并且已经提出了类似的问题,但我无法通过它。

public static Document removeDiv(Document document){

    document.getElementById("Wrapper_FixedWidth_Footer").remove();
    document.getElementById("u01").remove();

   return document;
}`

请将以下文档作为方法的输入。

Document doc = Jsoup.connect("https://www.oracle.com/storage/san/fs1/index.html").ignoreHttpErrors(true).userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:31.0) Gecko/20100101 Firefox/31.0").timeout(0).get(); 

更具体地说,我不想包含页眉和页脚。 (我不希望链接在本文档的页眉和页脚的相应div下)

1 个答案:

答案 0 :(得分:1)

问题得到解决。似乎我在代码的其他部分检查爬虫和条件存在一些问题。