我有一个很大的字符串,在方括号中包含很多数字。例如:
[1]这是一个例子 ... [123]另一个例子
如何从文本字符串中删除数字和括号?
我当前的从文件中提取文本的代码:
text = txtFile.read()
text = str(text)
text = text.replace("\\n", " ")
text = " ".join(text.split())
答案 0 :(得分:3)
尝试使用re.sub
:
import re
text = txtFile.read()
text = str(text)
text = re.sub(r'\[\d+\]', '', text)
正则表达式模式\[\d+\]
应该与其中具有一个或多个数字的任何括号项匹配。
请注意,默认情况下,re.sub
会替换整个输入字符串。