我正在尝试将列表列表转换为数组,并且发生了一些奇怪的事情。
例如,如果我将列表声明为:
a=[]
a.append(['a',1,10,100])
a.append(['b',2,20,200])
a.append(['c',3,30,300])
a.append(['d',4,40,400])
然后通过
转换为矢量a=np.array(a)
最终结果是
[['a','1','1','1'],['b','2','2','2'],['c','3','3','3'],['d','4','4','4']]
我是一个完整的Python初学者,但是从我通过使用np.array读到的内容中,向量中的所有内容都被转换为字符串(如果我错了,请纠正我)。为什么在这里忽略零,我该怎么做才能修复它?
答案 0 :(得分:5)
由于您的数组具有非统一数据类型,因此您必须指定“结构化”dtype
In [2]: a = [('a', 1, 10, 100),
...: ('b', 2, 20, 200),
...: ('c', 3, 30, 300),
...: ('d', 4, 40, 400)]
In [3]: a = np.array(a, dtype = "S1, int, int, int")
In [4]: a
Out[4]:
array([('a', 1, 10, 100),
('b', 2, 20, 200),
('c', 3, 30, 300),
('d', 4, 40, 400)],
dtype=[('f0', 'S1'), ('f1', '<i8'), ('f2', '<i8'), ('f3', '<i8')])
您可以轻松访问:
In [5]: a.dtype.names = ['name','x','y','z']
In [6]: a['x']
Out[6]: array([1, 2, 3, 4])
In [7]: a['name']
Out[7]:
array(['a', 'b', 'c', 'd'],
dtype='|S1')
In [8]: a[0]
Out[8]: ('a', 1, 10, 100)
答案 1 :(得分:3)
这是因为数组的结果数据类型(numpy必须猜测)是“长度为1的字符串”。您需要指定最大项目大小:
In [51]: np.array(['a', 10])
Out[51]:
array(['a', '1'],
dtype='|S1')
In [56]: np.array(['a', 10], dtype=(str, 5))
Out[56]:
array(['a', '10'],
dtype='|S5')
In [57]: np.array(['a', 123456], dtype=(str, 5))
Out[57]:
array(['a', '12345'],
dtype='|S5')
In [58]: np.array(['a', 123456], dtype=(str, 6))
Out[58]:
array(['a', '123456'],
dtype='|S6')
你确定你的2d数组不应该是1d记录数组(参见askewchan的答案)?
答案 2 :(得分:3)
使用np.array
不会将所有内容转换为字符串。 numpy.array说:
“dtype:数据类型,可选 数组所需的数据类型。如果没有给出,那么类型将被确定为保持序列中的对象所需的最小类型。这个参数只能用于'upcast'数组。“
通常使用numpy你不应该混合类型。在你的例子中你做。我的猜测是,numpy试图猜测你的参数的正确类型,这导致向上转换为类似字符串的东西。但它确实出了问题。我没有足够的经验来确切地说出发生了什么。所以也许聪明的人会解决这个问题。我建议numpy.dtype进一步阅读。你可以用它做一些魔术。
我建议您在创建numpy.array
时坚持使用一种类型。特别是当它被设计用于执行计算时,你试图潜入一些字符串/字符。我不确定你想做什么计算。
编辑: 是的,我想我是个笨蛋。结构化dtype似乎是混合类型数组的完美方式。