我想用python提取txt文件的特定部分。
这是我的代码:
import re
with open('test1.txt') as test_text:
data = test_text.read()
wanted_match = re.findall('start(\n.*?)+?end', data)
wanted_match_str = ",".join(wanted_match)
with open("output.txt", "w") as output:
output.write(wanted_match_str)
我的txt文件看起来像这样(包括换行符):
blablabla 开始blobloblobloblo bloblo blobloblo 结束 BLA blablabla 开始blobloblobloblo bloblo blobloblo 结束 BLA blablabla
等等。我想只提取文本的bloblob部分并将它们写入文件(而不是blabla部分)。 根据pythex我的正则表达式应该工作(http://pythex.org),但我得到的只是我的输出是一个逗号列表。 你能帮助我吗? 提前致谢! majee