了解numpy数组如何在内存中布局

时间:2013-02-13 00:59:01

标签: python numpy

我正在尝试使用numpy在python中使用构建OpenGL纹理,但我遇到了问题,因为我无法预测numpy数组将如何组织在内存中。下面的示例程序(应该按原样运行)说明了我的困惑:

from pylab import *

array_by_hand = array(
    [[[1, 2, 3, 4], [1, 2, 3, 4]], 
    [[1, 2, 3, 4], [1, 2, 3, 4]]], dtype='uint8')

layers = 1 * ones((2, 2)), 2 * ones((2, 2)), 3 * ones((2, 2)), 4 * ones((2, 2))
array_from_layers = dstack(layers)
array_from_layers = array_from_layers.astype('uint8')

print array_by_hand; print
print array_from_layers; print

print ' '.join(x.encode('hex') for x in array_by_hand.data)
print ' '.join(x.encode('hex') for x in array_from_layers.data)
print
print all(array_by_hand == array_from_layers)                 # True
print str(array_by_hand.data) == str(array_from_layers.data)  # False

虽然就python而言两个数组是等价的,但是在内存中的布局不同,因此OpenGL以不同的方式显示。有人可以解释为什么会发生这种情况以及如何将两个阵列强制转换为相同的格式吗?

1 个答案:

答案 0 :(得分:4)

如果改为调用tostring方法,它会将数组转换为C连续布局:

>>> array_by_hand.tostring() == array_from_layers.tostring()
True

在您的情况下字符串不同的原因是dstack调用。它试图通过简单地组合源数组的底层数据然后更改numpy's stride information来将数组堆叠在一起。这导致数组不是C连续布局。