看到我的问题试图在一个简单的示例中复制它,以避免共享我的数据。
pd DF示例:
df_sample = pd.DataFrame([[1, 2], [3, 4], [5, 6], [float('nan'), 8]], columns=["A", "B"])
尝试使用以下方法计算所有列的均值:
df_sample.mean()
效果很好,但
df_sample.mode()
不能像下面的输出中所示的平均值那样工作:
任何想法为什么以及如何使用类似于df.mode()的方式获取所有列的模式?我的目的是在模式中使用多个变量插补丢失的数据,而在我的原始版本中并没有用模式替换NaN数据。
df_sample['A'].fillna(df_sample['A'].mode())
但是现在我意识到,似乎模式本身在定义上存在问题。有任何想法吗?预先感谢!