使用Python从文件中的符号之间提取文本块

时间:2012-12-06 19:24:54

标签: python regex extract

我有一个类似于这样的txt文件:

=-=-=-=-=-=-=-=-=-=-=\n

data report

=-=-=-=-=-=-=-=-=-=-=\n

\n

\n

=-=-=-=-=-=-=-=-=-=-=\n

data report

=-=-=-=-=-=-=-=-=-=-=\n

\n

\n

......等等

我希望能够提取每个数据报告并对其执行各种操作(例如,打印特定的#,作为我拥有的其他字典中的键值,将其写入另一个文件等) 。我该怎么做呢?我一直在努力学习正则表达式,但是由于我是python的新手,所以一直很困惑,请帮忙!

1 个答案:

答案 0 :(得分:0)

你可以把整个文件读成一个字符串,在= - = - = ...字符串上拆分,然后从你的报告中删除前导和尾随空格,如下所示:

s = open(filename).read()
reports = [x.strip() for x in s.split('=-=-=-=-=-=-=-=-=-=-=\n')]