Question

我有一个列表，其中包含来自docx文件的文本数据。我如何应用一些正则表达式或一些lambda函数来遍历整个列表并“清理”它；意思是，我想取出\t和\n

['\tSA   [WP5]\t\t\n', "<class 'docx.text.paragraph.Paragraph'>\n", '\t\tCOUNTRY:\n', "<class 'docx.text.paragraph.Paragraph'>\n", '\n']

这样我的输出看起来像：

['SA   [WP5]', "<class 'docx.text.paragraph.Paragraph'>", 'COUNTRY:', "<class 'docx.text.paragraph.Paragraph'>", '']

Answer 1

[x.replace('\t', '').replace('\n', '') for  x in lst]

可以做到这一点，而无需正则表达式。