假设我有一个包含此内容的文本文件:
Hello World我的名字是Sam
我12岁,还是个男孩
我喜欢披萨
我想把它存储成一个大字符串,没有换行符,没有空格或任何东西,所以它会这样读:
HelloWorldMynameisSamIam12yearsoldandaboyIlikePizza
我该怎么做?谷歌没有太多帮助。
答案 0 :(得分:2)
您可以使用正则表达式,例如:
import re
with open('input') as fin:
long_string = re.sub(r'\W', '', fin.read())
# HelloWorldMynameisSamIam12yearsoldandaboyIlikePizza
请注意\W
是等价的。到[^a-zA-Z0-9_]
,如果您想明确任何非ascii字母/数字,可以将其更改为[^a-zA-Z0-9]
。