更改对象类型的重新排列列的dtype

时间:2013-05-17 05:09:02

标签: python arrays numpy recarray

我有一个csv文件,其中两列(v3和v7)对于所有观察都是空白的:

v1,v2,v3,v4,v5,v6,v7
GNB,1980,,20,-1.168689,0.4619077,
GNB,1981,20,-1.185176,0.4619077,

我正在使用csv2rec函数将其读入python(epd-7.0-2):

from pylab import rec2csv, csv2rec
all_data = csv2rec(infile)

当我尝试在第三行或第七行中增加值时,我收到一个错误(其他列不会发生):

all_data = csv2rec(infile)
all_data.v3 = 'test'

RuntimeError:无法在对象数组上调用setfield

所以我尝试更改类型,只是遇到其他错误:

all_data.v3.dtype = '|S30'
TypeError: Cannot change data-type for object array.

另一个问题是我无法更改数组中的其他列:

all_data.v1 = 'test'
RuntimeError: cannot call setfield on an object array

思考?谢谢,

1 个答案:

答案 0 :(得分:2)

使用.astype方法:

all_data.astype(dtype=[('v1', 'S3'), ('v2', '<i4'), ('v3', '|S30'), ('v4', '<f8'), ('v5', '<f8'), ('v6', '<f8'), ('v7', 'O')])
#rec.array([('GNB', 1980, '-1', 20.0, -1.168689, 0.4619077, None),
#           ('GNB', 1981, '20', -1.185176, 0.4619077, nan, None)], 
#             dtype=[('v1', 'S3'), ('v2', '<i4'), ('v3', 'S30'), ('v4', '<f8'), ('v5', '<f8'), ('v6', '<f8'), ('v7', 'O')])