我有这个HTML
<table class="table">
<tr >
<th colspan="3" ><center>2019-01-01<br>Some Text </center></th>
</tr>
我需要获得 2019-01-01 ,我在Kotlin尝试了此操作
var table = doc.select("table.table")[1]
var rows = table.select("tr")
for (row in rows) {
val th = row.select("th")
if (th.attr("colspan")=="3"){
val date= th.select("center")
}
但这可以获取所有数据,我如何才能提取<center>
内和<br>
之前的内容
答案 0 :(得分:0)
如果要提取<br>
之前的文本,可以将其拆分:
val date = th.select("center").html().split("<br>").first()
这将获取整个<center>
标签,获取html表示形式,使用<br>
作为定界符将其拆分,然后获取first()
值(左侧)。