为什么Numpy中的0d数组不被认为是标量?

时间:2009-04-21 15:02:52

标签: python numpy

肯定是一个0d阵列是标量,但Numpy似乎并不这么认为......我错过了什么或者我只是误解了这个概念?

>>> foo = numpy.array(1.11111111111, numpy.float64)
>>> numpy.ndim(foo)
0
>>> numpy.isscalar(foo)
False
>>> foo.item()
1.11111111111

2 个答案:

答案 0 :(得分:119)

人们不应该考虑太多。它最终会改善个人的心理健康和长寿。

Numpy标量类型的奇怪情况是由于没有优雅和一致的方法将1x1矩阵降级为标量类型。尽管在数学上它们是相同的,但它们由非常不同的代码处理。

如果你一直在做任何数量的科学代码,最终你会希望像max(a)这样的东西能够处理各种大小的矩阵,甚至是标量。在数学上,这是一个非常明智的预期。但是对于程序员来说,这意味着Numpy中的任何提示标量都应该具有.shape和.ndim attirbute,所以至少ufuncs不必对Numpy中21种可能的标量类型的输入进行显式类型检查。

另一方面,它们也应该与现有的Python库一起工作, 对标量类型进行显式类型检查。这是一个两难的问题,因为Numpy ndarray在被缩减为标量时必须单独改变它的类型,并且如果没有对所有访问进行检查,就无法知道是否已经发生了这种情况。实际上走这条路线可能会使标量类型标准的工作变得有点可笑。

Numpy开发人员的解决方案是从ndarray和Python标量继承其自己的scalary类型,以便所有标量也有.shape,.ndim,.T等等.1x1矩阵仍将存在,但其如果你知道你将要处理一个标量,那么将不鼓励使用。虽然这在理论上应该可以正常工作,偶尔你仍然可以看到一些他们错过了油漆滚筒的地方,丑陋的内脏暴露在所有人看来:

>>> from numpy import *
>>> a = array(1)
>>> b = int_(1)
>>> a.ndim
0
>>> b.ndim
0
>>> a[...]
array(1)
>>> a[()]
1
>>> b[...]
array(1)
>>> b[()]
1

a[...]a[()]真的没有理由回归不同的东西,但确实如此。有一些建议可以改变这一点,但看起来他们忘了完成1x1阵列的工作。

一个潜在的更大,可能是不可解决的问题,是Numpy标量不可变的事实。因此,将标量“喷射”到ndarray中,数学上将阵列折叠成标量的伴随操作是PITA实现的。你实际上不能生成一个Numpy标量,它根本无法被投射到一个ndarray中,即使newaxis神秘地使用它:

>>> b[0,1,2,3] = 1
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'numpy.int32' object does not support item assignment
>>> b[newaxis]
array([1])

在Matlab中,增加标量的大小是一种完全可以接受的无脑操作。在Numpy中,您必须在任何地方坚持使用a = array(a) 认为您可以从标量开始并以数组结束。我理解为什么Numpy必须以这种方式与Python玩得很好,但这并没有改变许多新的切换器对此深感困惑的事实。有些人有明显的记忆力来挣扎于这种行为,并最终坚持不懈,而其他太远的人通常会留下一些深深无形的精神疤痕,经常困扰着他们最无辜的梦想。这对所有人来说都是一个丑陋的情况。

答案 1 :(得分:5)

你必须以不同的方式创建标量数组:

>>> x = numpy.float64(1.111)
>>> x
1.111
>>> numpy.isscalar(x)
True
>>> numpy.ndim(x)
0

看起来scalars in numpy可能与您从纯粹的数学观点习惯的概念有点不同。我猜你在考虑标量矩阵?