什么是Python缓冲区类型?

时间:2010-08-06 09:55:45

标签: python python-2.7

python中有buffer类型,但我不知道如何使用它。

Python doc中,说明是:

  

buffer(object[, offset[, size]])

     

object参数必须是支持缓冲区调用接口的对象(例如字符串,数组和缓冲区)。将创建一个引用object参数的新缓冲区对象。缓冲区对象将是从对象的开头(或从指定的偏移量)开始的切片。切片将延伸到对象的末尾(或者具有由size参数给出的长度)。

2 个答案:

答案 0 :(得分:127)

示例用法:

>>> s = 'Hello world'
>>> t = buffer(s, 6, 5)
>>> t
<read-only buffer for 0x10064a4b0, size 5, offset 6 at 0x100634ab0>
>>> print t
world

这种情况下的缓冲区是一个子字符串,从位置6开始,长度为5,并且不占用额外的存储空间 - 它引用了一个字符串片段。

这对于像这样的短字符串不是很有用,但在使用大量数据时可能是必要的。此示例使用可变bytearray

>>> s = bytearray(1000000)   # a million zeroed bytes
>>> t = buffer(s, 1)         # slice cuts off the first byte
>>> s[1] = 5                 # set the second element in s
>>> t[0]                     # which is now also the first element in t!
'\x05'

如果您希望在数据上有多个视图并且不希望(或不能)在内存中保存多个副本,这将非常有用。

请注意,{3}已被Python 3中名称较好的buffer取代,但您可以在Python 2.7中使用。

另请注意,如果不深入研究C API,就无法为自己的对象实现缓冲接口,也就是说,不能用纯Python来实现。

答案 1 :(得分:22)

我认为缓冲是例如在将python连接到本机库时很有用。 (Guido van Rossum在this mailinglist post中解释buffer。)

例如,numpy似乎使用缓冲区来进行有效的数据存储:

import numpy
a = numpy.ndarray(1000000)

a.data是:

<read-write buffer for 0x1d7b410, size 8000000, offset 0 at 0x1e353b0>