使用python修改xml文件

时间:2014-04-19 17:55:11

标签: python xml

我有一个文件,从一些行开始,我想删除直到“<?xml version =”1.0“?>” 此行以及以下两行应替换为:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<TimeML xmlns:ns0="xsi" ns0:noNamespaceSchemaLocation="http://timeml.org/timeMLdocs/TimeML_1.2.1.xsd" xmlns:ns1="xmlns" ns1:xsi="http://www.w3.org/2001/XMLSchema-instance">
<DOCID>doc3</DOCID>
<DCT>Sun Feb 24 15:25:40 CET 2013</DCT>
<TEXT>*1*9*6*9*

是否可以在“DCT”中添加相同格式的实际日期?

并且:在文件的末尾,“&lt; / TimeML&gt;”之前的一行,我应该添加“&lt; / TEXT&gt;”。这也可能吗?

我已经可以解决问题的第一部分,即删除我不想要的部分:

with open(fileName,'r+') as f:
   contents=f.read()
   contents=contents[contents.find('<?xml version="1.0"?>'):]
   f.seek(0)
   f.write(contents)
   f.truncate()

非常感谢您的帮助! :)

1 个答案:

答案 0 :(得分:0)

对于日期格式化,您可以查看this topic

要替换XML文件的末尾,您有以下几种选择:

  • 按照您的方式行事,将所有内容替换为</TimeML>,再加上</TimeML>
  • 或者您可以将某些XML解析器用作BeautifulSoup