numpy.array工作不正常?

时间:2013-04-03 15:25:34

标签: python arrays numpy

我正在尝试将列表列表转换为数组,并且发生了一些奇怪的事情。

例如,如果我将列表声明为:

a=[]
a.append(['a',1,10,100])
a.append(['b',2,20,200])
a.append(['c',3,30,300])
a.append(['d',4,40,400])

然后通过

转换为矢量
a=np.array(a)

最终结果是

[['a','1','1','1'],['b','2','2','2'],['c','3','3','3'],['d','4','4','4']]

我是一个完整的Python初学者,但是从我通过使用np.array读到的内容中,向量中的所有内容都被转换为字符串(如果我错了,请纠正我)。为什么在这里忽略零,我该怎么做才能修复它?

3 个答案:

答案 0 :(得分:5)

由于您的数组具有非统一数据类型,因此您必须指定“结构化”dtype

In [2]: a = [('a', 1, 10, 100),
   ...:      ('b', 2, 20, 200),
   ...:      ('c', 3, 30, 300),
   ...:      ('d', 4, 40, 400)]

In [3]: a = np.array(a, dtype = "S1, int, int, int")

In [4]: a
Out[4]: 
array([('a', 1, 10, 100),
       ('b', 2, 20, 200),
       ('c', 3, 30, 300),
       ('d', 4, 40, 400)], 
      dtype=[('f0', 'S1'), ('f1', '<i8'), ('f2', '<i8'), ('f3', '<i8')])

您可以轻松访问:

In [5]: a.dtype.names = ['name','x','y','z']

In [6]: a['x']
Out[6]: array([1, 2, 3, 4])

In [7]: a['name']
Out[7]: 
array(['a', 'b', 'c', 'd'], 
      dtype='|S1')

In [8]: a[0]
Out[8]: ('a', 1, 10, 100)

答案 1 :(得分:3)

这是因为数组的结果数据类型(numpy必须猜测)是“长度为1的字符串”。您需要指定最大项目大小:

In [51]: np.array(['a', 10])
Out[51]:
array(['a', '1'],
      dtype='|S1')

In [56]: np.array(['a', 10], dtype=(str, 5))
Out[56]:
array(['a', '10'],
      dtype='|S5')

In [57]: np.array(['a', 123456], dtype=(str, 5))
Out[57]:
array(['a', '12345'],
      dtype='|S5')

In [58]: np.array(['a', 123456], dtype=(str, 6))
Out[58]:
array(['a', '123456'],
      dtype='|S6')

Numpy data types

你确定你的2d数组不应该是1d记录数组(参见askewchan的答案)?

答案 2 :(得分:3)

使用np.array不会将所有内容转换为字符串。 numpy.array说:

“dtype:数据类型,可选 数组所需的数据类型。如果没有给出,那么类型将被确定为保持序列中的对象所需的最小类型。这个参数只能用于'upcast'数组。“

通常使用numpy你不应该混合类型。在你的例子中你做。我的猜测是,numpy试图猜测你的参数的正确类型,这导致向上转换为类似字符串的东西。但它确实出了问题。我没有足够的经验来确切地说出发生了什么。所以也许聪明的人会解决这个问题。我建议numpy.dtype进一步阅读。你可以用它做一些魔术。

我建议您在创建numpy.array时坚持使用一种类型。特别是当它被设计用于执行计算时,你试图潜入一些字符串/字符。我不确定你想做什么计算。

编辑: 是的,我想我是个笨蛋。结构化dtype似乎是混合类型数组的完美方式。