尝试找到答案,但一直无法找到我正在寻找的东西。我正在尝试创建一个python脚本,它将在文本文件中找到字符串连接,并将它们转换为单个字符串。
例如,该文件将包含:
"h" + "e" + "l" + "l" + "o" + world;
我希望有一个脚本将其转换为:
"hello" + world;
如果这样的事情是可行的,我可以得到一些关于如何编写这样的脚本的指示吗?
答案 0 :(得分:0)
您可以尝试在找到" + "
时删除它。表面上看,它只能在两个连接的字符串之间找到。下面的正则表达式将删除以下序列:双引号,0或1个空白字符,加号,0或1个空白字符,以及另一个双引号。
import re
with open('filename.txt', 'r') as fp:
cleaned_text = [re.sub(r'"\W?\+\W?"', '',line) for line in fp]
# example
> re.sub(r'"\W?\+\W?"', '','"h" + "e" + "l" + "l" + "o" + world;')
# "hello" world;