我有一个类似
的大型XML文件<data> skdfnlsniisimsoinfsdfoisdfinsdofinodnfonf <emrosem> 23324097234097g </emrosem>
<peto> oifmisnie </peto>
</data>
<data> sfnseosfnosefoisneofinseionfoaisenfoisen <emrosem> 3249087203470w </emrosem>
<peto> sdfn </peto>
</data>
我想把它分成一个看起来像
的列表 [<data> skdfnlsniisimsoinfsdfoisdfinsdofinodnfonf <emrosem> 23324097234097g </emrosem>
<peto> oifmisnie </peto></data>, <data> sfnseosfnosefoisneofinseionfoaisenfoisen
<emrosem> 3249087203470w </emrosem> <peto> sdfn </peto> </data>]
换句话说,我想根据“数据”一词将其拆分。
我正在使用python 2.7,感谢您的帮助。
答案 0 :(得分:2)
包含的XML Parser是解析XML的一种方法。从中获取数据并将其标记为完整的列表可能有点麻烦,但它应该是可行的。
答案 1 :(得分:0)
请不要使用正则表达式。如果需要解析XML,请使用XML解析器。 XML只是有太多的细微之处来处理简单的字符串操作例程。有关原因的详细解释,请参阅this question的第一个答案。