我收到一大堆代码,只能用pandas数据帧作为输入。我目前有一个非常大的numpy数组。我需要将其转换为pandas数据帧。
Dataframe将是288行(289列计数列名称)和1801列。我有一个大小为1801的数组,它将是数据框中的所有列名。然后我有一个大小的数组(288)将填充第一列。然后我有一个形状阵列(1800,288),将填充列2-1801。是否有一种简单的方法可以将其转换为数据框而无需单独定义所有1801列?
我知道我可以定义像column2 = array [0,:],column3 = array [1,:]这样的列,但这对于1801列来说很有用。
答案 0 :(得分:5)
您可以将numpy数组直接传递给DataFrame构造函数:
In [11]: a = np.random.rand(3, 5)
In [12]: a
Out[12]:
array([[ 0.46154984, 0.08813473, 0.57746049, 0.42924157, 0.34689139],
[ 0.29731858, 0.83300176, 0.15884604, 0.44753895, 0.56840054],
[ 0.02479636, 0.76544594, 0.24388046, 0.06679485, 0.94890838]])
In [13]: pd.DataFrame(a)
Out[13]:
0 1 2 3 4
0 0.461550 0.088135 0.577460 0.429242 0.346891
1 0.297319 0.833002 0.158846 0.447539 0.568401
2 0.024796 0.765446 0.243880 0.066795 0.948908
In [14]: pd.DataFrame(a.T)
Out[14]:
0 1 2
0 0.461550 0.297319 0.024796
1 0.088135 0.833002 0.765446
2 0.577460 0.158846 0.243880
3 0.429242 0.447539 0.066795
4 0.346891 0.568401 0.948908