在JSoup中提取特定的表数据

时间:2016-01-11 13:48:58

标签: java html parsing jsoup

我有以下HTML代码:

<tr>
    <td class="legend" data-v1="conceded" data-v2="Average</td>
    <td data-v1="29" data-v2="1.45">29</td>
    <td data-v1="14" data-v2="1.40">14</td>
    <td data-v1="15" data-v2="1.50">15</td>
</tr>

我试图得到数字'29','14'和'15',但我不知道他们的地址是什么来选择它们。我可以使用以下代码获取带有类名的td:

        try {

            Document doc = Jsoup.connect(URL).get();

            Elements E = doc.select(".team-stats.line-end > tbody > tr > td.legend");
            System.out.println(E.text());

        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }

但是,具有数字的人没有类或ID名称。我怎样才能指出他们单独提取这些内容。

1 个答案:

答案 0 :(得分:0)

试试这个选择器:

.team-stats.line-end > tbody > tr > td:not(:first-child)

或者:

.team-stats.line-end > tbody > tr > td:not(.legend)

如果您想引用显式排除该类。