我有一个csv文件,其中两列(v3和v7)对于所有观察都是空白的:
v1,v2,v3,v4,v5,v6,v7
GNB,1980,,20,-1.168689,0.4619077,
GNB,1981,20,-1.185176,0.4619077,
我正在使用csv2rec函数将其读入python(epd-7.0-2):
from pylab import rec2csv, csv2rec
all_data = csv2rec(infile)
当我尝试在第三行或第七行中增加值时,我收到一个错误(其他列不会发生):
all_data = csv2rec(infile)
all_data.v3 = 'test'
RuntimeError:无法在对象数组上调用setfield
所以我尝试更改类型,只是遇到其他错误:
all_data.v3.dtype = '|S30'
TypeError: Cannot change data-type for object array.
另一个问题是我无法更改数组中的其他列:
all_data.v1 = 'test'
RuntimeError: cannot call setfield on an object array
思考?谢谢,
答案 0 :(得分:2)
使用.astype
方法:
all_data.astype(dtype=[('v1', 'S3'), ('v2', '<i4'), ('v3', '|S30'), ('v4', '<f8'), ('v5', '<f8'), ('v6', '<f8'), ('v7', 'O')])
#rec.array([('GNB', 1980, '-1', 20.0, -1.168689, 0.4619077, None),
# ('GNB', 1981, '20', -1.185176, 0.4619077, nan, None)],
# dtype=[('v1', 'S3'), ('v2', '<i4'), ('v3', 'S30'), ('v4', '<f8'), ('v5', '<f8'), ('v6', '<f8'), ('v7', 'O')])