使用<br/>标签解析html(Python)

时间:2015-11-12 23:00:58

标签: python html xpath lxml

我使用lxml来解析一些html。 HTML看起来像:

<td valign="top">first text field<br>second text field</td>

不,断线标记不会在任何地方关闭。

element.text返回两个中的第一个,element.xpath('string()')返回两个没有\n或其他分隔符。

我想我可以解析两次&#34;减去&#34;如果我只想要第二个文本字段,前者来自后者,但这并不理想。我假设必须有其他方法来获得第二个文本字段,但我很难过。

1 个答案:

答案 0 :(得分:2)

回答自己。 element.xpath('text()')返回我正在寻找的两件事的数组。