为什么shape会返回我的熊猫数据框的大小(xxxx,),而不是(xxxx,1)?

时间:2018-11-10 19:18:33

标签: python pandas

我在数据框中使用train_test_split,我的代码如下所示:

df = pd.read_csv('data.csv', header=None)
y = df[0]
X_train, X_test, y_train, y_test = train_test_split(df, y,test_size=0.2, random_state=0)

当我打印y.shape或y_train.shape时,它正在返回(2871,)。当我打印y或y_train时,它返回我期望的结果,它是文件中所有y值的列表,所以为什么形状不是(2871,1)?

1 个答案:

答案 0 :(得分:0)

这就是numpy打印出一维数组的方式。熊猫在后台使用numpy制作数据框,因此可以得到这种形状。转到二维或更高维度后,您将开始在形状元组中看到更多的值。 Some examples from numpy's documentation