我有一个文件,从一些行开始,我想删除直到“<?xml version =”1.0“?>” 此行以及以下两行应替换为:
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<TimeML xmlns:ns0="xsi" ns0:noNamespaceSchemaLocation="http://timeml.org/timeMLdocs/TimeML_1.2.1.xsd" xmlns:ns1="xmlns" ns1:xsi="http://www.w3.org/2001/XMLSchema-instance">
<DOCID>doc3</DOCID>
<DCT>Sun Feb 24 15:25:40 CET 2013</DCT>
<TEXT>*1*9*6*9*
是否可以在“DCT”中添加相同格式的实际日期?
并且:在文件的末尾,“&lt; / TimeML&gt;”之前的一行,我应该添加“&lt; / TEXT&gt;”。这也可能吗?
我已经可以解决问题的第一部分,即删除我不想要的部分:
with open(fileName,'r+') as f:
contents=f.read()
contents=contents[contents.find('<?xml version="1.0"?>'):]
f.seek(0)
f.write(contents)
f.truncate()
非常感谢您的帮助! :)
答案 0 :(得分:0)
对于日期格式化,您可以查看this topic。
要替换XML文件的末尾,您有以下几种选择:
</TimeML>
,再加上</TimeML>