我在向python中的tar arhive添加str
时遇到问题。在python 2中我使用了这样的方法:
fname = "archive_name"
params_src = "some arbitrarty string to be added to the archive"
params_sio = io.StringIO(params_src)
archive = tarfile.open(fname+".tgz", "w:gz")
tarinfo = tarfile.TarInfo(name="params")
tarinfo.size = len(params_src)
archive.addfile(tarinfo, params_sio)
它与here中的内容基本相同。 它运作良好。但是,转到python 3它会破坏并导致以下错误:
File "./translate_report.py", line 67, in <module>
main()
File "./translate_report.py", line 48, in main
archive.addfile(tarinfo, params_sio)
File "/usr/lib/python3.2/tarfile.py", line 2111, in addfile
copyfileobj(fileobj, self.fileobj, tarinfo.size)
File "/usr/lib/python3.2/tarfile.py", line 276, in copyfileobj
dst.write(buf)
File "/usr/lib/python3.2/gzip.py", line 317, in write
self.crc = zlib.crc32(data, self.crc) & 0xffffffff
TypeError: 'str' does not support the buffer interface
说实话,我无法理解它的来源,因为我没有将任何str
传递给tarfile
模块回到我构造StringIO
对象的位置。
我知道StringIO
和str
的含义,字节等从python 2改为3但我没有看到错误,也无法找到更好的逻辑来解决这个任务。
我精确地创建StringIO
对象,以便为我想要添加到存档的字符串提供缓冲区方法。然而,有些str
没有提供它,这让我感到震惊。最重要的是,围绕似乎负责校验和计算的行引发了异常。
有人可以解释我错过的理解或至少举例说明如何在tar档案中添加一个简单的str
而不在文件系统上创建中间文件。
答案 0 :(得分:4)
写入文件时,需要将unicode数据显式编码为字节; StringIO
个对象不会为您执行此操作,它是 text 内存文件。请改用io.BytesIO()
并编码:
params_sio = io.BytesIO(params_src.encode('utf8'))
当然,您可以根据数据调整编码。