如何按关键字拆分文件?

时间:2011-07-12 19:42:59

标签: python xml list split

我有一个类似

的大型XML文件
<data> skdfnlsniisimsoinfsdfoisdfinsdofinodnfonf <emrosem> 23324097234097g </emrosem> 

<peto> oifmisnie </peto>

</data>

<data> sfnseosfnosefoisneofinseionfoaisenfoisen <emrosem> 3249087203470w </emrosem>

<peto> sdfn </peto>

</data>

我想把它分成一个看起来像

的列表
 [<data> skdfnlsniisimsoinfsdfoisdfinsdofinodnfonf <emrosem> 23324097234097g </emrosem> 
 <peto> oifmisnie </peto></data>, <data> sfnseosfnosefoisneofinseionfoaisenfoisen             
 <emrosem> 3249087203470w </emrosem> <peto> sdfn </peto> </data>]

换句话说,我想根据“数据”一词将其拆分。

我正在使用python 2.7,感谢您的帮助。

2 个答案:

答案 0 :(得分:2)

包含的XML Parser是解析XML的一种方法。从中获取数据并将其标记为完整的列表可能有点麻烦,但它应该是可行的。

答案 1 :(得分:0)

请不要使用正则表达式。如果需要解析XML,请使用XML解析器。 XML只是有太多的细微之处来处理简单的字符串操作例程。有关原因的详细解释,请参阅this question的第一个答案。