我试图使用python从文件中删除大块文本。每个文本块都以
开头/翻译=" SOMETEXT"
以第二个引语结束。
任何人都可以就如何做到这一点给我一些建议吗?
谢谢
答案 0 :(得分:1)
您可以像这样使用re.sub:
import re
re.sub("/translation=\".*?\" ", "", s)
答案 1 :(得分:0)
答案 2 :(得分:0)
如果表现无关紧要,你可以这样做。正则表达式可能会更快,但这更简单。
def remtxt(s,startstr,endstr):
while startstr in s:
startpos=s.index(startstr)
try:
endpos=s.index(endstr,startpos+len(startstr))+len(endstr)
except:
return
s=s[:startpos]+s[endpos:]
return s
new_string=remtxt(my_string,'/translation="','"')