Jsoup:在类名中获取带空格的表

时间:2016-10-17 18:28:54

标签: java html parsing jsoup

我是Jsoup的新手,对HTML不是很专业。我试图从网站的表格中获取一些数据。

如果我检查我需要的桌子上的元素(来自Chrome),我得到:

<table class=" table-main" id="tournamentTable!>
<colgroup>...</colgroup>
<tbody>...</tbody>
</table>

当我运行命令

Elements e = doc.select("table.table-main");

然后打印了e的内容,我注意到它需要另一个类为<table class="table-main top-event">的页面表。

由于在类名class=" table-main"中有一个虚空间,我做了其他尝试,比如doc.select("table[class= table-main]");,但这给了我一个0大小的元素。

我试着看一下HTML代码,但我注意到没有带有类名的表#34;表主&#34 ;.可能是这个原因?

1 个答案:

答案 0 :(得分:0)

首先,看起来HTML无效id="tournamentTable!而不是id="tournamentTable"。这可能会导致JSOUP解析器出现一些困难。

其次,如果您尝试选择示例中引用的锦标赛表,那么我建议您选择ID而不是css类:doc.select("#tournamentTable")