BeautifulSoup-即使标签中包含其他标签,也可以从标签中获取文本

时间:2019-11-29 15:50:59

标签: python string parsing beautifulsoup space

假设我有以下列表:

l = [<p>NC:<strong> 1</strong></p>, <p>APC<strong> 2</strong></p>, <p>GED<strong> 3</strong></p>]

并且该列表中每个元素的类型都是bs4.element.Tag

我想要得到的是一个看起来像这样的列表:

ll = ['NC: 1','APC: 2','GED: 3']

我试图做的是这样的:

ll = [element.get_text() for element in l]

但是它返回:

['NC:\xa01', 'APC:\xa02', 'GED:\xa03']

在我看来,<strong></strong>之间的空格似乎有些问题。有什么办法可以做到这一点?

1 个答案:

答案 0 :(得分:0)

好,我找到了答案,解决方法是:

ll = [entrance.get_text(strip=True) for entrance in l]