我需要以某种方式获取始终低于<br>
class
的{{1}}代码中的电话号码。
firmheader
我尝试过:
<td class='second' valign='top'>
<div class='firmheader'>Police departament</div>
<br><h2 class='subtitle'>Adress</h2>New Jersey <a class='discret' target='_top' title='See NJ departamant' href='/nj/dep'>NJ</a>, Phone: +160923490434</br>
没有成功。
答案 0 :(得分:1)
首先获取最近的外部标签的文本。在你的html片段中它是<td>
。 <br>
标记没有结束标记。
String address = doc.select("td.second").text();
现在你得到“警察部门新泽西州新泽西州电话:+160923490434”文字,你需要使用正则表达式获取“电话”字段。