我想知道如何在\ begin语句和\ end语句之间打印所有文本。 这是我的代码。 另外,如何禁止打印这两个陈述之间的某些词?
content=open("file", "r")
print content
content.read()
while len(content.split(start,1)) > 1:
start=("\begin")
end=("\end")
s=content
print find_between( s, "\begin", "\end" )
def find_between( s, first, last ):
try:
start = s.index( first ) + len( first )
end = s.index( last, start )
return s[start:end]
except ValueError:
return ""
print find_between( s, "\begin", "\end" )
答案 0 :(得分:1)
此示例假设您不介意丢失\begin
和\end
行上的数据。它会在\begin
和\end
之间打印所有出现的数据。
f = open("file", "r")
content = f.readlines()
f.close()
start = "\\begin"
end = "\\end"
print "Start ==", start, "End ==", end
printlines = False
for line in content:
if start in line:
printlines = True
continue
if end in line:
printlines = False
continue
if printlines == True:
print line
输入文件 -
test
\begin do re me fa
so la te do.
do te la so \end fa me re do
输出 -
Start == \begin End == \end
so la te do.
答案 1 :(得分:0)
假设文件中只有一个“\ begin”到“\ end”块:
f = open('file', 'r')
between = ''
in_statement = False
for line in f:
if '\begin' in line:
in_statement = True
if in_statement:
between += line
if '\end' in line:
in_statement = False
break
print between
f.close()
答案 2 :(得分:0)
正则表达式对这类事情有好处。
In [152]: import re
In [153]: s = 'this is some \\begin string that i need to check \end some more\\begin and another \end stuff after'
In [167]: re.findall(r'\\begin(.*?)\\end', s)
[' string that i need to check ',
' and another ']
正则表达式:
使用原始字符串,因为\对正则表达式解析器意味着什么。 \ begin和\ end是要匹配的原始字符串。你必须做两次反斜杠,因为反斜杠对正则表达式来说意味着“特殊”,所以你需要\来实际匹配一个反斜杠。 。*? = dot匹配任何内容,*表示匹配0或更多重复。的?关闭贪婪的行为 - 否则,它将匹配FIRST开始和最后结束之间的所有内容,而不是匹配之间的所有内容。
然后findall会为您提供所有匹配项的列表。