cssselect(lxml,python)没有返回“多行文本”

时间:2018-10-25 16:23:06

标签: python web-scraping lxml

在我的项目中,我通过

获取表的一行中一列的文本内容。

bzs = tr.cssselect(".column-description")

我可以在bzs[0].text中找到文本,但是... 如果文本被一个或多个<br />破坏,我只会得到第一行。我需要怎么做才能获得全文? 来源是这样的:

<td class="column-bezeichnung">
   text / more text,    
   <br />
   a) line 2,
   <br />
   b) line 3,
   <br />
   line 4
</td>

bzn[0].text只给我“ text / more text,", missing is "line 2,", "line 3," and "line 4"

类似问题(Retrieving tail text from html)中的解决方案由于设置不同而无法使用。当然,拥有更多经验的人也许可以轻松换位。但是我不是那么有经验。 感谢您尝试帮助我!

0 个答案:

没有答案