Python将大型numpy数组转换为pandas数据帧

时间:2017-02-09 23:11:10

标签: python arrays pandas numpy dataframe

我收到一大堆代码,只能用pandas数据帧作为输入。我目前有一个非常大的numpy数组。我需要将其转换为pandas数据帧。

Dataframe将是288行(289列计数列名称)和1801列。我有一个大小为1801的数组,它将是数据框中的所有列名。然后我有一个大小的数组(288)将填充第一列。然后我有一个形状阵列(1800,288),将填充列2-1801。是否有一种简单的方法可以将其转换为数据框而无需单独定义所有1801列?

我知道我可以定义像column2 = array [0,:],column3 = array [1,:]这样的列,但这对于1801列来说很有用。

1 个答案:

答案 0 :(得分:5)

您可以将numpy数组直接传递给DataFrame构造函数:

In [11]: a = np.random.rand(3, 5)

In [12]: a
Out[12]:
array([[ 0.46154984,  0.08813473,  0.57746049,  0.42924157,  0.34689139],
       [ 0.29731858,  0.83300176,  0.15884604,  0.44753895,  0.56840054],
       [ 0.02479636,  0.76544594,  0.24388046,  0.06679485,  0.94890838]])

In [13]: pd.DataFrame(a)
Out[13]:
          0         1         2         3         4
0  0.461550  0.088135  0.577460  0.429242  0.346891
1  0.297319  0.833002  0.158846  0.447539  0.568401
2  0.024796  0.765446  0.243880  0.066795  0.948908

In [14]: pd.DataFrame(a.T)
Out[14]:
          0         1         2
0  0.461550  0.297319  0.024796
1  0.088135  0.833002  0.765446
2  0.577460  0.158846  0.243880
3  0.429242  0.447539  0.066795
4  0.346891  0.568401  0.948908