Spark DataFrame:将列中的空值替换为平均值

时间:2018-06-25 07:34:24

标签: python apache-spark dataframe

我在Spark(Python)中有一个DataFrame,其中的列包含空值。我希望用所有点的平均值替换该列(“点”列中包含浮点数)的空值。

我尝试过:

myDF = myDF.fillna(mean(myDF['points']), subset=['points']))

但是我得到的错误是:

Value should be a float, int, long, string, bool or dict

有什么想法为什么不起作用?

0 个答案:

没有答案