我有一个如下所示的数据结构:
data = [ ('a', 1.0, 2.0),
('b', 2.0, 4.0),
('c', 3.0, 6.0) ]
我想使用numpy将其转换为结构化数组。但是,当我尝试以下操作时,我保留了浮动但我丢失了字符串信息:
import numpy
x = numpy.array(data, dtype=[('label', str), ('x', float), ('y', float)])
print x
导致:
>>> [('', 1.0, 2.0) ('', 2.0, 4.0) ('', 3.0, 6.0)]
有人可以解释为什么会发生这种情况,以及我如何保留字符串信息?
答案 0 :(得分:4)
如果您打印出阵列并仔细查看,则可以看到问题:
>>> numpy.array(data, dtype=[('label', str), ('x', float), ('y', float)])
array([('', 1.0, 2.0), ('', 2.0, 4.0), ('', 3.0, 6.0)],
dtype=[('label', '|S0'), ('x', '<f8'), ('y', '<f8')])
第一个字段的数据类型为'|S0'
- 零宽度字符串字段。使字符串字段更长 - 这是一个2字符串字段:
>>> numpy.array(data, dtype=[('label', 'S2'), ('x', float), ('y', float)])
array([('a', 1.0, 2.0), ('b', 2.0, 4.0), ('c', 3.0, 6.0)],
dtype=[('label', '|S2'), ('x', '<f8'), ('y', '<f8')])
您也可以这样做,如记录here:
>>> numpy.array(data, dtype=[('label', (str, 2)), ('x', float), ('y', float)])
array([('a', 1.0, 2.0), ('b', 2.0, 4.0), ('c', 3.0, 6.0)],
dtype=[('label', '|S2'), ('x', '<f8'), ('y', '<f8')])