我使用lxml来解析一些html。 HTML看起来像:
<td valign="top">first text field<br>second text field</td>
不,断线标记不会在任何地方关闭。
element.text
返回两个中的第一个,element.xpath('string()')
返回两个没有\n
或其他分隔符。
我想我可以解析两次&#34;减去&#34;如果我只想要第二个文本字段,前者来自后者,但这并不理想。我假设必须有其他方法来获得第二个文本字段,但我很难过。
答案 0 :(得分:2)
回答自己。 element.xpath('text()')
返回我正在寻找的两件事的数组。