使用Jsoup.Jar进行HTML解析

时间:2010-11-12 07:39:02

标签: java html-parsing jsoup

Document doc = Jsoup.connect("http://reviews.opentable.com/0938/9/reviews.htm").get();
    Element part = doc.body();
    Elements parts = part.getElementsByTag("span");
    String attValue;
    String html;
    for(Element ent : parts)
    {
        if(ent.hasAttr("class"))
        {
            attValue = ent.attr("class");
            if(attValue=="BVRRReviewText description")
            {
                System.out.println("\n");
                html=ent.text();
                System.out.println(html);
            }
        }
    }

使用Jsoup.jar进行上述程序。

我正在访问该网页,我的目的是打印标记<span class="BVRRReviewText description">text</span>中的文字。

但没有任何东西被打印为输出。程序中的String html没有添加任何内容。但是attValue获取了span标记的所有属性值。

我哪里必须出错?请指教。

2 个答案:

答案 0 :(得分:4)

if(attValue=="BVRRReviewText description")

应该是

肯定是

if(attValue.equals("..."))

这是Java,而不是Javascript。

答案 1 :(得分:0)

更改

attValue=="BVRRReviewText description"

代表

attValue.matches("...")