我们在表单中有一个元组列表(年份,值):
splist
[(2002, 10.502535211267606),
(2003, 10.214794520547946),
(2004, 9.8115789473684227),
..
(2015, 9.0936585365853659),
(2016, 9.2442725379351387)]
目的是将元组列表转换为二维numpy数组。但是,使用np.asarray
的已发布答案会保留单个维度:
dt = np.dtype('int,float')
spp = np.asarray(splist,dt)
spp
array([(2002, 10.502535211267606), (2003, 10.214794520547946),
(2004, 9.811578947368423), (2005, 9.684155844155844),
..
(2014, 9.438987341772153), (2015, 9.093658536585366),
(2016, 9.244272537935139)],
dtype=[('f0', '<i8'), ('f1', '<f8')])
在查看输出的尺寸时,这一点变得清晰:
In [155]: spp.shape
Out[155]: (15,)
我们想要的:
array([[(2002, 10.502535211267606)],
[(2003, 10.214794520547946)],
..
[(2014, 9.438987341772153)],
[(2015, 9.093658536585366)],
[(2016, 9.244272537935139)]])
那么将元组列表转换为 两个 维数组的魔力是什么?
答案 0 :(得分:7)
如果您想要二维结果,只需使用np.array
,而不是asarray
:
>>> a = [(2002, 10.502535211267606),
... (2003, 10.214794520547946),
... (2004, 9.8115789473684227),
... (2015, 9.0936585365853659),
... (2016, 9.2442725379351387)]
>>> np.array(a)
array([[ 2002. , 10.50253521],
[ 2003. , 10.21479452],
[ 2004. , 9.81157895],
[ 2015. , 9.09365854],
[ 2016. , 9.24427254]])
>>> np.array(a).shape
(5, 2)
请注意,这将使两个列的浮点dtype。不可能在每列中具有具有不同dtypes的2D numpy阵列。如果你想 ,我认为Pandas有办法:虽然我没有任何Pandas经验。
你唯一可以用numpy做的就是拥有一个&#34;对象&#34;的一维数组。类型,每个元素都是一个元组 - 但这是你已经拥有的asarray
。
答案 1 :(得分:2)
如果我正确理解您所需的输出,您可以使用numpy.reshape
>>> spp = np.asarray(splist, dt)
>>> spp
array([(2002, 10.502535211267606),
(2003, 10.214794520547946),
(2004, 9.811578947368423),
(2015, 9.093658536585366),
(2016, 9.244272537935139)],
dtype=[('f0', '<i4'), ('f1', '<f8')])
>>> np.reshape(spp, (spp.size, 1))
array([[(2002, 10.502535211267606)],
[(2003, 10.214794520547946)],
[(2004, 9.811578947368423)],
[(2015, 9.093658536585366)],
[(2016, 9.244272537935139)]],
dtype=[('f0', '<i4'), ('f1', '<f8')])