我是Jsoup的新手,对HTML不是很专业。我试图从网站的表格中获取一些数据。
如果我检查我需要的桌子上的元素(来自Chrome),我得到:
<table class=" table-main" id="tournamentTable!>
<colgroup>...</colgroup>
<tbody>...</tbody>
</table>
当我运行命令
时Elements e = doc.select("table.table-main");
然后打印了e
的内容,我注意到它需要另一个类为<table class="table-main top-event">
的页面表。
由于在类名class=" table-main"
中有一个虚空间,我做了其他尝试,比如doc.select("table[class= table-main]");
,但这给了我一个0大小的元素。
我试着看一下HTML代码,但我注意到没有带有类名的表#34;表主&#34 ;.可能是这个原因?
答案 0 :(得分:0)
首先,看起来HTML无效id="tournamentTable!
而不是id="tournamentTable"
。这可能会导致JSOUP解析器出现一些困难。
其次,如果您尝试选择示例中引用的锦标赛表,那么我建议您选择ID而不是css类:doc.select("#tournamentTable")
。