为什么numpy.ravel会返回副本?

时间:2012-07-23 18:21:35

标签: python numpy

在以下示例中:

>>> import numpy as np
>>> a = np.arange(10)
>>> b = a[:,np.newaxis]
>>> c = b.ravel()
>>> np.may_share_memory(a,c)
False

为什么numpy.ravel会返回我的数组副本?它不应该只是返回a吗?

编辑:

我刚刚发现np.squeeze 没有返回副本。

>>> b = a[:,np.newaxis]
>>> c = b.squeeze()
>>> np.may_share_memory(a,c)
True

在这种情况下,为什么squeezeravel之间存在差异?

编辑:

正如mgilson指出的那样,newaxis将数组标记为不连续,这就是ravel返回副本的原因。

所以,新问题是为什么newaxis将数组标记为不连续。

但这个故事更加奇怪:

>>> a = np.arange(10)
>>> b = np.expand_dims(a,axis=1)
>>> b.flags
  C_CONTIGUOUS : True
  F_CONTIGUOUS : False
  OWNDATA : False
  WRITEABLE : True
  ALIGNED : True
  UPDATEIFCOPY : False
>>> c = b.ravel()
>>> np.may_share_memory(a,c)
True

根据expand_dims的文档,它应该等同于newaxis

2 个答案:

答案 0 :(得分:6)

这可能不是您问题的最佳答案,但看起来插入newaxis会导致numpy将阵列视为非连续 - 可能是出于广播目的:

>>> a=np.arange(10)
>>> b=a[:,None]
>>> a.flags
  C_CONTIGUOUS : True
  F_CONTIGUOUS : True
  OWNDATA : True
  WRITEABLE : True
  ALIGNED : True
  UPDATEIFCOPY : False
>>> b.flags
  C_CONTIGUOUS : False
  F_CONTIGUOUS : False
  OWNDATA : False
  WRITEABLE : True
  ALIGNED : True
  UPDATEIFCOPY : False

然而,重塑不会导致:

>>> c=a.reshape(10,1) 
>>> c.flags
  C_CONTIGUOUS : True
  F_CONTIGUOUS : False
  OWNDATA : False
  WRITEABLE : True
  ALIGNED : True
  UPDATEIFCOPY : False

这些数组确实共享相同的内存:

>>> np.may_share_memory(c.ravel(),a)
True

修改

np.expand_dims实际上是使用reshape实现的,这就是它工作的原因(这在我认为的文档中有轻微错误)。这是源(没有docstring):

def expand_dims(a,axis):
    a = asarray(a)
    shape = a.shape
    if axis < 0:
        axis = axis + len(shape) + 1
    return a.reshape(shape[:axis] + (1,) + shape[axis:])

答案 1 :(得分:3)

看起来它可能与步幅有关:

>>> c = np.expand_dims(a, axis=1)
>>> c.strides
(8, 8)

>>> b = a[:, None]
>>> b.strides
(8, 0)
>>> b.flags
  C_CONTIGUOUS : False
  F_CONTIGUOUS : False
  OWNDATA : False
  WRITEABLE : True
  ALIGNED : True
  UPDATEIFCOPY : False
>>> b.strides = (8, 8)
>>> b.flags
  C_CONTIGUOUS : True
  F_CONTIGUOUS : False
  OWNDATA : False
  WRITEABLE : True
  ALIGNED : True
  UPDATEIFCOPY : False

我不确定维度1在这里的步幅有什么不同,但看起来这就是让numpy将数组视为不连续的原因。