在我的项目中,我通过
获取表的一行中一列的文本内容。 bzs = tr.cssselect(".column-description")
我可以在bzs[0].text
中找到文本,但是...
如果文本被一个或多个<br />
破坏,我只会得到第一行。我需要怎么做才能获得全文?
来源是这样的:
<td class="column-bezeichnung">
text / more text,
<br />
a) line 2,
<br />
b) line 3,
<br />
line 4
</td>
bzn[0].text
只给我“ text / more text,", missing is "line 2,", "line 3," and "line 4"
。
类似问题(Retrieving tail text from html)中的解决方案由于设置不同而无法使用。当然,拥有更多经验的人也许可以轻松换位。但是我不是那么有经验。 感谢您尝试帮助我!