使用jsoup从体育软件“class”中的“span”内部的“a”中提取属性

时间:2017-05-02 16:34:43

标签: java html css jsoup

我一直在阅读有关jsoup和属性,类,跨度等的所有问题。但没有人可以帮助我从这个网站获取这些数据。

我正在研究一些体育软件并从网站soccer24.com检索匹配数据  现在我想从特定的匹配页面获得更多数据(双赢历史)

所以我需要最后的分数,或者更好的“胜利”或“失败”结果

分数写得像这样:

<td class="" style="cursor: pointer;"><span class="score"><strong>2 : 1</strong></span></td>

在这里,我可以使用“2:1”

这就是我现在尝试的:

Elements wl =docl.select("span.score");
                            System.out.println(wl);
                        for(Element w :wl){

                                            System.out.println(w.ownText());

                                        }

结果如下:

<td class="winLose" style="cursor: pointer;"><span class="winLoseIcon"><a title="Win" class="form-bg-last form-w"><span></span></a></span></td>

这里我需要一个标题中的“胜利”

香港专业教育学院我真的尝试了所有东西,但是无法提取它...真的很感激任何帮助.....在我再提出另一个问题之前......我还需要机会...... 我得到了最后的赔率但是这些动作是这样写的:

<span class="up" alt="1.73[u]1.75">1.75</span>

所以“alt”属性

如果我能得到所有这些东西会很棒我知道这对你来说不是什么大不了的事,但我现在已经试了好几个小时了,这真的是我的最后一招

提前感谢:)

1 个答案:

答案 0 :(得分:0)

如果我理解你的问题,你想从元素中提取属性?如果是的话,

修改 现在看来你真正的问题不是JSOUP解析,而是获取内容。

该链接包含#h2h;整体。表示它没有从服务器获得实际响应,但它在加载页面后发出ajax请求到另一个URL(http://d.soccer24.com/x/feed/d_hh_K2AUJ0ih_en_2

当我检查响应时,我发现它重复调用服务器并更新结果。此请求和响应都是加密的。更新后的代码应显示正确的结果。

// ** Test Data
//Document doc = Jsoup.parse("<html><body><h1></h1><table>"
//          + "<td class=\"winLose\" style=\"cursor: pointer;\"><span class=\"winLoseIcon\"><a title=\"Win\" class=\"form-bg-last form-w\"><span></span></a></span></td>"
//          + "<span class=\"up\" alt=\"1.73[u]1.75\">1.75</span>" + "</table>/</body></html>");
//
Connection con = Jsoup.connect("http://d.soccer24.com/x/feed/d_hh_K2AUJ0ih_en_2");
    con.header("X-Fsign", "SW9D1eZo");
    Document doc = con.get();
//Your code
Elements elems=doc.select("td.winLose > span.winLoseIcon > a[title]");
for(Element elem:elems){
    System.out.println(elem.attr("title"));
}

同样的赔率:

Elements elems=doc.select("span.up[alt]"); 
for(Element elem:elems) println( elem.attr("alt"));

结果:

..Lots of lines Win | Lose | Draw..