将元组列表转换为numpy数组会产生单维

时间:2016-11-14 19:46:56

标签: python arrays numpy

我们在表单中有一个元组列表(年份,值):

splist

[(2002, 10.502535211267606),
 (2003, 10.214794520547946),
 (2004, 9.8115789473684227),
  ..
 (2015, 9.0936585365853659),
 (2016, 9.2442725379351387)]

目的是将元组列表转换为二维numpy数组。但是,使用np.asarray的已发布答案会保留单个维度:

dt = np.dtype('int,float')
spp = np.asarray(splist,dt)

spp
   array([(2002, 10.502535211267606), (2003, 10.214794520547946),
   (2004, 9.811578947368423), (2005, 9.684155844155844),
   ..
   (2014, 9.438987341772153), (2015, 9.093658536585366),
   (2016, 9.244272537935139)],
  dtype=[('f0', '<i8'), ('f1', '<f8')])

在查看输出的尺寸时,这一点变得清晰:

In [155]: spp.shape
Out[155]: (15,)

我们想要的

   array([[(2002, 10.502535211267606)],
        [(2003, 10.214794520547946)],
   ..
   [(2014, 9.438987341772153)], 
   [(2015, 9.093658536585366)],
   [(2016, 9.244272537935139)]])

那么将元组列表转换为 两个 维数组的魔力是什么?

2 个答案:

答案 0 :(得分:7)

如果您想要二维结果,只需使用np.array,而不是asarray

>>> a = [(2002, 10.502535211267606),
...  (2003, 10.214794520547946),
...  (2004, 9.8115789473684227),
...  (2015, 9.0936585365853659),
...  (2016, 9.2442725379351387)]
>>> np.array(a)    
array([[ 2002.        ,    10.50253521],
       [ 2003.        ,    10.21479452],
       [ 2004.        ,     9.81157895],
       [ 2015.        ,     9.09365854],
       [ 2016.        ,     9.24427254]])
>>> np.array(a).shape
(5, 2)

请注意,这将使两个列的浮点dtype。不可能在每列中具有具有不同dtypes的2D numpy阵列。如果你想 ,我认为Pandas有办法:虽然我没有任何Pandas经验。

你唯一可以用numpy做的就是拥有一个&#34;对象&#34;的一维数组。类型,每个元素都是一个元组 - 但这是你已经拥有的asarray

答案 1 :(得分:2)

如果我正确理解您所需的输出,您可以使用numpy.reshape

>>> spp = np.asarray(splist, dt)
>>> spp
array([(2002, 10.502535211267606),
       (2003, 10.214794520547946),
       (2004, 9.811578947368423),
       (2015, 9.093658536585366),
       (2016, 9.244272537935139)], 
      dtype=[('f0', '<i4'), ('f1', '<f8')])

>>> np.reshape(spp, (spp.size, 1))
array([[(2002, 10.502535211267606)],
       [(2003, 10.214794520547946)],
       [(2004, 9.811578947368423)],
       [(2015, 9.093658536585366)],
       [(2016, 9.244272537935139)]], 
      dtype=[('f0', '<i4'), ('f1', '<f8')])