mmap和gzip可以协作吗?

时间:2011-02-26 15:57:04

标签: python gzip mmap

我正在尝试使用gzip压缩文件来使用mmap。这甚至可能吗?

import mmap
import os
import gzip

filename = r'C:\temp\data.gz'

file = gzip.open(filename, "rb+")
size = os.path.getsize(filename)

file = mmap.mmap(file.fileno(), size)

print file.read(8)

输出数据被压缩。

2 个答案:

答案 0 :(得分:12)

嗯,不是你想要的方式。

如果压缩数据是您想要的,则可以使用

mmap()来访问gzip压缩文件。

mmap()是一个系统调用,用于将磁盘块映射到RAM,就像添加swap一样。

您无法使用mmap()将未压缩的数据映射到RAM中,因为它不在磁盘上。

答案 1 :(得分:12)

你可以做得很轻松。实际上,gzip模块将可选参数作为类文件对象。

import mmap
import gzip

filename = "a.gz"
handle = open(filename, "rb")
mapped = mmap.mmap(handle.fileno(), 0, access=mmap.ACCESS_READ)
gzfile = gzip.GzipFile(mode="r", fileobj=mapped)

print gzfile.read()

这同样适用于tarfile模块:

import sys
import mmap
import tarfile

f = open(sys.argv[1], 'rb')
fo = mmap.mmap(f.fileno(), 0, access=mmap.ACCESS_READ)
tf = tarfile.open(mode='r:gz', fileobj=fo)

print tf.getnames()