如何从python文件中剪切特定文本(大约1.5亿行)? 我的意思是程序必须找到一个单词和一个结尾单词,并将其剪切在这些行之间。 我正在尝试类似的事情:
with bz2.BZ2File(file, 'r','utf-8') as f:
for line in f:
counter += 1
if line.strip() == '<title>Viriato da Cruz</title>': #or whatever title you need
break
elif counter > 1000:
break
print('bla')
for line in f:
counter += 1
if line.strip() == '</text>' :
break
print(line)