我试图将numpy nd数组转换为pandas列, 但数据随附括号。
这是我的np数组:
array([[[ 7.10105920e+07],
[ 9.18736320e+07],
[ 8.35562800e+07],
[ 7.16590640e+07],
[ 8.28060960e+07],
[ 6.77042000e+07],
[ 7.07195360e+07],
[ 1.04754616e+08],
[ 7.27420400e+07],
[ 7.33461760e+07],
[ 6.34156040e+07],
[ 8.00440800e+07],
这就是我发送到数据帧的方式:
predictions = pd.DataFrame()
predictions['y_test'] = Y_test[0].tolist()
这就是我得到的:
y_test
0 [71010592.0]
1 [91873632.0]
2 [83556280.0]
3 [71659064.0]
4 [82806096.0]
5 [67704200.0]
6 [70719536.0]
7 [104754616.0]
8 [72742040.0]
9 [73346176.0]
如何删除括号([])?
答案 0 :(得分:4)
它看起来像一个3D阵列。您可以将其第一个元素传递给DataFrame构造函数:
pd.DataFrame(Y_test[0], columns=['y_test'])
Out:
y_test
0 71010592.0
1 91873632.0
2 83556280.0
3 71659064.0
4 82806096.0
5 67704200.0
6 70719536.0
7 104754616.0
8 72742040.0
9 73346176.0
10 63415604.0
11 80044080.0
Divakar更好的选择是使用挤压:
pd.DataFrame(arr.squeeze(), columns=['y_test'])
Out:
y_test
0 71010592.0
1 91873632.0
2 83556280.0
3 71659064.0
4 82806096.0
5 67704200.0
6 70719536.0
7 104754616.0
8 72742040.0
9 73346176.0
10 63415604.0
11 80044080.0
答案 1 :(得分:3)
看来你有一个3d数组,你可以尝试:
predictions['y_test'] = Y_test[0,:,0]
predictions
# y_test
#0 71010592.0
#1 91873632.0
#2 83556280.0
#3 71659064.0
#4 82806096.0
#5 67704200.0
#6 70719536.0
#7 104754616.0
#8 72742040.0
#9 73346176.0
#10 63415604.0
#11 80044080.0
答案 2 :(得分:1)
你可以做的几种方式
选项1。 Numpy索引
predictions['y_test'] = Y_test[0,:,0]
选项2。使用列表理解展平
predictions['y_test'] = [x[0] for x in Y_test[0]]
选项3。 Numpy展平功能
predictions['y_test'] = Y_test.flatten()
答案 3 :(得分:0)
prediction = pd.DataFrame(Y_test.flatten(), columns=['y_test'])
prediction.head()
y_test
0 1.0
1 1.0
2 1.0
3 1.0
4 1.0