假设我有以下列表:
l = [<p>NC:<strong> 1</strong></p>, <p>APC<strong> 2</strong></p>, <p>GED<strong> 3</strong></p>]
并且该列表中每个元素的类型都是bs4.element.Tag
我想要得到的是一个看起来像这样的列表:
ll = ['NC: 1','APC: 2','GED: 3']
我试图做的是这样的:
ll = [element.get_text() for element in l]
但是它返回:
['NC:\xa01', 'APC:\xa02', 'GED:\xa03']
在我看来,<strong></strong>
之间的空格似乎有些问题。有什么办法可以做到这一点?
答案 0 :(得分:0)
好,我找到了答案,解决方法是:
ll = [entrance.get_text(strip=True) for entrance in l]