如何在Python3中将字符串添加到tarfile

时间:2012-12-21 11:06:41

标签: python-3.x stringio tarfile

我在向python中的tar arhive添加str时遇到问题。在python 2中我使用了这样的方法:

fname = "archive_name"
params_src = "some arbitrarty string to be added to the archive"

params_sio = io.StringIO(params_src)
archive = tarfile.open(fname+".tgz", "w:gz")
tarinfo = tarfile.TarInfo(name="params")
tarinfo.size = len(params_src)
archive.addfile(tarinfo, params_sio)

它与here中的内容基本相同。 它运作良好。但是,转到python 3它会破坏并导致以下错误:

  File "./translate_report.py", line 67, in <module>
    main()
  File "./translate_report.py", line 48, in main
    archive.addfile(tarinfo, params_sio)
  File "/usr/lib/python3.2/tarfile.py", line 2111, in addfile
    copyfileobj(fileobj, self.fileobj, tarinfo.size)
  File "/usr/lib/python3.2/tarfile.py", line 276, in copyfileobj
    dst.write(buf)
  File "/usr/lib/python3.2/gzip.py", line 317, in write
    self.crc = zlib.crc32(data, self.crc) & 0xffffffff
  TypeError: 'str' does not support the buffer interface

说实话,我无法理解它的来源,因为我没有将任何str传递给tarfile模块回到我构造StringIO对象的位置。 我知道StringIOstr的含义,字节等从python 2改为3但我没有看到错误,也无法找到更好的逻辑来解决这个任务。

我精确地创建StringIO对象,以便为我想要添加到存档的字符串提供缓冲区方法。然而,有些str没有提供它,这让我感到震惊。最重要的是,围绕似乎负责校验和计算的行引发了异常。

有人可以解释我错过的理解或至少举例说明如何在tar档案中添加一个简单的str而不在文件系统上创建中间文件。

1 个答案:

答案 0 :(得分:4)

写入文件时,需要将unicode数据显式编码为字节; StringIO个对象不会为您执行此操作,它是 text 内存文件。请改用io.BytesIO()并编码:

params_sio = io.BytesIO(params_src.encode('utf8'))

当然,您可以根据数据调整编码。