通过正则表达式提取XML块

时间:2015-06-30 08:55:46

标签: python regex

我试图在大文件中提取具有给定时间属性的XML实体:

<afs>
<af timestamp="Jun 30 09:11:58 2015">
...
</af>
<af timestamp="Jun 30 09:13:20 2015">
....
</af>
</afs>

我在bash / sed中使用此脚本获取了所有块,但我找不到任何使用Python的好方法。

m1=`date '+%b %d %H:%M' -d "-1min"`
m2=`date '+%b %d %H:%M' -d "-2min"`
sed -n "/^<af .*\($m1\|$m2)/,/^<\/af>/p" $LOG 

由于操作系统对Python 2.4.3的限制,我无法使用ElementTree 提前致谢。

0 个答案:

没有答案