Question

我正在将熊猫系列添加为数据框中的新列，并观察到无人值守的更改。

X_test_col["Valor real ppna"]=y_test_pd
print (np.all(y_test_pd.iloc[0].dtype=="float64"), np.all(X_test_col["Valor real ppna"].dtype=="float64"))

输出

True True

然后

print (len(y_test_pd), len(X_test_col["Valor real ppna"]))

输出

9000 9000

然后

print (round(X_test_col["Valor real ppna"].count()))

输出

最后

print (round(y_test_pd.count()))

输出：

ppna (kg/ha.dia)    9000
dtype: int64

您会看到该列

 X_test_col["Valor real ppna"]

分配为新列实际上显示为具有与原始系列相同的长度和相同的dtype。但是当我尝试使用这些值时，它们似乎是256个而不是我期望的9000个。我已经在这个问题上工作了几个小时，试图分配dtype等等，等等，我需要一些帮助。如何正确地将9000值分配给新的dataframe列？仅供参考：y_test_pd来自sklearn train_test_split（）函数。

为了更好地解释，我将数据框传递给excel。这是原始数据集：

这是要添加的列

这是所需的输出：

将列添加到熊猫数据框时出现问题

0 个答案: