改变结构化/记录数组的dtypes

时间:2011-10-29 20:47:40

标签: python numpy

Q1。将列重新表述为其他数据类型时,首选是np.array还是np.astype?我见过使用np.astype的示例,但两者似乎都返回了所需的结果(两个都是原始数组的返回副本)。

import numpy as np

## recasting string to integer
x = np.rec.array([('a','1'),('b','2')],names='col1,col2')
##
In []: x
Out[]: 
rec.array([('a', '1'), ('b', '2')], 
      dtype=[('col1', '|S1'), ('col2', '|S1')])
##
dt = x.dtype.descr
dt[1] = (dt[1][0],'int')
## which is more appropriate:
y = np.array(x,dtype=dt)
## or
y = x.astype(dt)
## ?
In []: y
Out[]: 
rec.array([('a', 1), ('b', 2)], 
      dtype=[('col1', '|S1'), ('col2', '<i4')])

Q2。重命名列:调用np.array时整数列变为零,但使用np.rec.array保留其值。为什么?我的理解是,对于前者,你得到一个结构化数组,后者返回一个记录数组;对于大多数目的,我认为它们是相同的。无论如何,这种行为令人惊讶。

## rename 2nd column from col2 to v2
dt = copy.deepcopy(y.dtype)
names = list(dt.names)
names[1] = 'v2'
dt.names = names
## this is not right
newy = np.array(y,dtype=dt)
In []: newy
Out[]: 
array([('a', 0), ('b', 0)], 
      dtype=[('col1', '|S1'), ('v2', '<i4')])
## this is correct
newy = np.rec.array(y,dtype=dt)
In []: newy
Out[]: 
rec.array([('a', 1), ('b', 2)], 
      dtype=[('col1', '|S1'), ('v2', '<i4')])

1 个答案:

答案 0 :(得分:3)

Q1 np.arraynp.astype方法在引擎盖下以相同的方式执行相同的工作。使用np.astype只需少一点打字,读者更清楚的是打算更改数据类型。