有没有人可以告诉我为什么只有8项,虽然html中有44项?

时间:2013-04-22 04:26:46

标签: jsoup

我想从网站中提取一些信息,但是select方法返回的div计数是8,而不是实际44。为什么?这是我的计划:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;

import cornerstone.util.URLUtils;

public class Temp {

    public static void main(String[] args) throws Exception {
        Document doc = Jsoup.parse(URLUtils.toURL("http://s.taobao.com/search?q=耳塞"), 3000);
        System.out.println(doc.select("div.col.item.icon-datalink").size());
    }
}

1 个答案:

答案 0 :(得分:0)

使用您的代码本身没有任何问题。它准确地计算了它看到的HTML中匹配元素的数量。浏览器中额外的36个元素都加载了JavaScript。为了证明这一点

  • 使用浏览器的DOM检查器查看纯HTML页面源(),或
  • 加载禁用JavaScript的页面