我偶然发现了一些不是问题的东西,但却令人费解。我正在将xml文件myxml.xml
复制到myxml_copy.xml
,并且输出文件的文件大小更大。我不明白为什么会这样。这与文件编码有关吗?
无论如何,我正在使用的代码(虽然它相当简单):
from xml.dom.minidom import parseString
import sys
def parseXml():
data = open(in_filename,'r').read()
return data
try:
in_filename = sys.argv[1]
out_filename = sys.argv[2]
out_file = open(out_filename,'w')
out_file.write(parseXml())
out_file.close()
except Exception,e:
print "usage: python copy.py <in_file> <out_file>"
print "Error",e
注意:我不正在寻找复制文件的方法。我将在稍后修改原始的xml文件(剪切和粘贴它的不同部分)。
答案 0 :(得分:7)
我认为问题在于您打开文件的模式需要rb
而不仅仅是r
和wb
而不是w
。 (表示 - 使用二进制模式)
当它是rb
时,\r\n
之类的字符串将保持这种状态,但当模式为r
时,它们将变为\n
。
简而言之 - 只需更改行:
data = open(in_filename,'r').read()
out_file = open(out_filename,'w')
到
data = open(in_filename,'rb').read()
out_file = open(out_filename,'wb')
这有帮助吗?