删除字符串python列表中所有元素的两个分隔符之间的所有文本

时间:2017-11-29 07:06:53

标签: python html parsing

我的列表包含表示html表信息的字符串,我想删除标签中的额外信息 即。这就是最初的内容

<td style="color: red;">

这就是我想要的     <td>

到目前为止,我已经尝试过这种情况,其中table是我的字符串列表

[re.sub(r'<td[.*?]>','<td>',x,re.DOTALL) for x in tables]

把头发拉出来,我知道这是一个容易修复的东西,任何人都可以提出建议吗?

谢谢!

是的,我确实需要使用正则表达式,不应该使用任何额外的html导入......

0 个答案:

没有答案