我正在将熊猫系列添加为数据框中的新列,并观察到无人值守的更改。
X_test_col["Valor real ppna"]=y_test_pd
print (np.all(y_test_pd.iloc[0].dtype=="float64"), np.all(X_test_col["Valor real ppna"].dtype=="float64"))
输出
True True
然后
print (len(y_test_pd), len(X_test_col["Valor real ppna"]))
输出
9000 9000
然后
print (round(X_test_col["Valor real ppna"].count()))
输出
256
最后
print (round(y_test_pd.count()))
输出:
ppna (kg/ha.dia) 9000
dtype: int64
您会看到该列
X_test_col["Valor real ppna"]
分配为新 列实际上显示为具有与原始系列相同的长度和相同的dtype。 但是当我尝试使用这些值时,它们似乎是256个而不是我期望的9000个。 我已经在这个问题上工作了几个小时,试图分配dtype等等,等等,我需要一些帮助。 如何正确地将9000值分配给新的dataframe列? 仅供参考:y_test_pd来自sklearn train_test_split()函数。
为了更好地解释,我将数据框传递给excel。 这是原始数据集:
这是要添加的列
这是所需的输出: