检查numpy数组

时间:2016-10-28 19:29:40

标签: python-3.x numpy isinstance

我有不同类型的数据。其中大多数是int,有时是floatint的大小不同,因此大小为8/16/32位 对于这种情况,我创建了一个数字型转换器。因此,我使用isinstence()检查类型。这是因为我读过isinstance()type()更差。

关键是我得到的很多数据都是numpy数组。我使用spyder作为IDE,然后我看到变量也是一个类型。但是当我输入isinstance(var,'type i read')时,我得到False

我做了一些检查:

a = 2.17 
b = 3 
c = np.array(np.random.rand(2, 8))
d = np.array([1])

我得到isinstance(var,type)

isinstance(a, float)
True
isinstance(b, int)
True
isinstance(c, float)  # or isinstance(c, np.float64)
False
isinstance(d, int)  # or isinstance(c, np.int32)
False
当我问

时,

cd为真

isinstance(c, np.ndarray)
True
isinstance(d, np.ndarray)
True

我可以查看ndarray中的步骤

isinstance(c[i][j], np.float64)
True
isinstance(d[i], np.int32)
True

但这意味着对于每个维度,我必须添加一个新索引,否则它再次为False。 我可以使用dtype ...

c.dtype == 'float64'来查看类型

Oke所以我找到并尝试了... 我的问题很基本:

  • var.dtype方法与isinstance()type()(最差/更好等)相比如何?
  • 如果var.dtype更差,因为isinstance() isinstance()中有一些方法没有全部手动索引? (自动索引等)?

5 个答案:

答案 0 :(得分:6)

数组是np.ndarray类型的对象。它的值或元素存储在数据缓冲区中,可以将其视为连续的内存字节块。数据缓冲区中的字节没有类型,因为它们不是Python对象。

该数组有一个dtype参数,用于解释这些字节。如果dtypeint32(有各种同义词),则4个字节被解释为整数。访问一个元素,比如c[0]给出了一个取决于dtype的新对象,例如对象类型np.int32

c[0].item将给出相应类型的Python对象:

In [2102]: c=np.array([1])
In [2103]: c.dtype
Out[2103]: dtype('int32')
In [2104]: type(c)
Out[2104]: numpy.ndarray
In [2105]: type(c[0])
Out[2105]: numpy.int32
In [2107]: c[0].item()
Out[2107]: 1
In [2108]: type(c[0].item())
Out[2108]: int

(而c[0].dtypec.dtype相同;您无需索引数组的各个元素来检查其dtype。

此数组的相同4个字节可视为dtype int8 - 单字节整数。

In [2112]: c.view('b')
Out[2112]: array([1, 0, 0, 0], dtype=int8)

此备用视图的单个元素是np.int8,但是当我使用item()时,我得到一个Python整数。没有int8 Python数字类型。

In [2113]: type(c.view('b')[0])
Out[2113]: numpy.int8
In [2115]: type(c.view('b')[0].item())
Out[2115]: int

列表包含指向Python对象的指针,每个对象都有一个类型。 dtype=object数组也是如此。但是常见的数字数组不包含Python整数或浮点数。它有一个数据缓冲区,可以根据dtype以各种方式解释。 Python整数的大小不同,至少与numpy dtypes的程度不同。

因此isinstancetype()内容不适用于ndarray的内容。

====================

从我收集的评论中,您试图将整数数组转换为float。你没有转换标量。如果是这样,那么dtype就是最重要的;数组始终具有dtype。目前还不清楚你是否可以将np.float32转换为np.float64

我建议您学习并尝试使用np.can_cast函数和x.astype方法。

x.astype(np.float64, copy=False)
例如,

将所有int dtypes转换为float,而不复制已经是float64的那些。它可以复制和转换np.float32个。

另请参阅这些函数的casting参数。

===========================

我在scipy.optimize.minimize另找到了一个测试工具

In [156]: np.typecodes
Out[156]: 
{'All': '?bhilqpBHILQPefdgFDGSUVOMm',
 'AllFloat': 'efdgFDG',
 'AllInteger': 'bBhHiIlLqQpP',
 'Character': 'c',
 'Complex': 'FDG',
 'Datetime': 'Mm',
 'Float': 'efdg',
 'Integer': 'bhilqp',
 'UnsignedInteger': 'BHILQP'}

它可用于检查整数:

if x0.dtype.kind in np.typecodes["AllInteger"]:
    x0 = np.asarray(x0, dtype=float)

答案 1 :(得分:1)

与@rasen58 和@hpaulj 略有不同:

要检查 np 数组 c 是否具有 float 类型的元素,c.dtype == np.floating 对我有用。

答案 2 :(得分:0)

numpy数组中的所有条目都属于同一类型。 numpy类型和Python类型不是一回事。这可能有点令人困惑,但numpy类型更像是像C这样的语言所使用的类型 - 你可能会说更接近机器的低级别。

你不能说哪种类型更好,因为它就像比较苹果和橘子。

答案 3 :(得分:0)

要直接回答问题,您可以执行以下操作:

isinstance(arr.flat[0], np.floating)

  • .flat将向下折叠任意数量的尺寸,因此您可以轻松访问第0个元素。
  • np.floating将匹配任何numpy浮点类型

答案 4 :(得分:0)

我写了一个小的包装器,其工作原理基本上与isinstance类似,并接受对象o和一个类(或类的元组)c。 唯一的区别是,如果isinstance(o, np.ndarray)True,则根据映射的numpy数据类型检查o.flat[0](请参见字典c2np) 我主要使用boolintfloatstr,但是可以更改/扩展此列表。 注意np.integernp.floating是大多数/全部的集合吗?可用的numpy子类型为np.int8,np.unit16,...

def np_isinstance(o, c):
    c2np = {bool: np.bool, int: np.integer, float: np.floating, str: np.str}

    if isinstance(o, np.ndarray):
        c = (c2np[cc] for cc in c) if isinstance(c, tuple) else c2np[c]
        return isinstance(o.flat[0], c)

    else:
        return isinstance(o, c)

一些例子:

# Like isinstance if o is not np.ndarray
np_isinstance(('this', 'that'), tuple)  # True
np_isinstance(4.4, int)                 # False
np_isinstance(4.4, float)               # True

#
np_isinstance(np.ones(4, dtype=int), int)    # True
np_isinstance(np.ones(4, dtype=int), float)  # False
np_isinstance(np.full((4, 4), 'bert'), str)  # True