用什么方法填充缺失值?

时间:2018-07-30 00:03:13

标签: pandas interpolation data-analysis data-cleaning imputation

我有以下imdb数据集

https://github.com/RUG-IDS/Course-2017/blob/master/Assignments/Assignment%201/movievalue.csv

我想清理数据集并填充缺失的值,但我注意到上述数据集中的零值太多,而且我不知道选择哪种方法来对零值进行插值。

我的目标是填补缺失的值,以便提取数据,检测趋势或模式,回答可能的问题。

enter image description here

上面的图像包括NaN值的总数和每列的0个值。

此外,我注意到“标题”列中包含非字母值,并且我不知道用NaN替换这些值然后填充NaN是否是一个好主意

enter image description here

0 个答案:

没有答案