将列添加到熊猫数据框时出现问题

时间:2020-02-01 14:50:35

标签: python pandas

我正在将熊猫系列添加为数据框中的新列,并观察到无人值守的更改。

X_test_col["Valor real ppna"]=y_test_pd
print (np.all(y_test_pd.iloc[0].dtype=="float64"), np.all(X_test_col["Valor real ppna"].dtype=="float64"))

输出

True True

然后

print (len(y_test_pd), len(X_test_col["Valor real ppna"]))

输出

9000 9000

然后

print (round(X_test_col["Valor real ppna"].count()))

输出

256

最后

print (round(y_test_pd.count()))

输出:

ppna (kg/ha.dia)    9000
dtype: int64

您会看到该列

 X_test_col["Valor real ppna"] 

分配为新 列实际上显示为具有与原始系列相同的长度和相同的dtype。 但是当我尝试使用这些值时,它们似乎是256个而不是我期望的9000个。 我已经在这个问题上工作了几个小时,试图分配dtype等等,等等,我需要一些帮助。 如何正确地将9000值分配给新的dataframe列? 仅供参考:y_test_pd来自sklearn train_test_split()函数。

为了更好地解释,我将数据框传递给excel。 这是原始数据集:

Original dataset

这是要添加的列

enter image description here

这是所需的输出:

enter image description here

0 个答案:

没有答案