Question

python中有buffer类型，但我不知道如何使用它。

在Python doc中，说明是：

buffer(object[, offset[, size]])

object参数必须是支持缓冲区调用接口的对象（例如字符串，数组和缓冲区）。将创建一个引用object参数的新缓冲区对象。缓冲区对象将是从对象的开头（或从指定的偏移量）开始的切片。切片将延伸到对象的末尾（或者具有由size参数给出的长度）。

Answer 1

示例用法：

>>> s = 'Hello world'
>>> t = buffer(s, 6, 5)
>>> t
<read-only buffer for 0x10064a4b0, size 5, offset 6 at 0x100634ab0>
>>> print t
world

这种情况下的缓冲区是一个子字符串，从位置6开始，长度为5，并且不占用额外的存储空间 - 它引用了一个字符串片段。

这对于像这样的短字符串不是很有用，但在使用大量数据时可能是必要的。此示例使用可变bytearray：

>>> s = bytearray(1000000)   # a million zeroed bytes
>>> t = buffer(s, 1)         # slice cuts off the first byte
>>> s[1] = 5                 # set the second element in s
>>> t[0]                     # which is now also the first element in t!
'\x05'

如果您希望在数据上有多个视图并且不希望（或不能）在内存中保存多个副本，这将非常有用。

请注意，{3}已被Python 3中名称较好的buffer取代，但您可以在Python 2.7中使用。

另请注意，如果不深入研究C API，就无法为自己的对象实现缓冲接口，也就是说，不能用纯Python来实现。

Answer 2

我认为缓冲是例如在将python连接到本机库时很有用。（Guido van Rossum在this mailinglist post中解释buffer。）

例如，numpy似乎使用缓冲区来进行有效的数据存储：

import numpy
a = numpy.ndarray(1000000)

a.data是：

<read-write buffer for 0x1d7b410, size 8000000, offset 0 at 0x1e353b0>

什么是Python缓冲区类型？

2 个答案: