我有以下imdb数据集
https://github.com/RUG-IDS/Course-2017/blob/master/Assignments/Assignment%201/movievalue.csv
我想清理数据集并填充缺失的值,但我注意到上述数据集中的零值太多,而且我不知道选择哪种方法来对零值进行插值。
我的目标是填补缺失的值,以便提取数据,检测趋势或模式,回答可能的问题。
上面的图像包括NaN值的总数和每列的0个值。
此外,我注意到“标题”列中包含非字母值,并且我不知道用NaN替换这些值然后填充NaN是否是一个好主意