如何替换图像数据的NaN值?

时间:2019-05-04 13:27:42

标签: python machine-learning

我的数据集共有200列,其中每一列对应于我所有图像中的相同像素。我总共有48,500行。数据标签的范围是0-9。

数据看起来像这样:

    raw_0   raw_1   raw_2   raw_3   raw_4
0   120.0   133.0   96.0    155.0   66.0
1   159.0   167.0   163.0   185.0   160.0
2   45.0    239.0   66.0    252.0   NaN
3   126.0   239.0   137.0   NaN 120.0
4   226.0   222.0   153.0   235.0   171.0
5   169.0   81.0    100.0   44.0    104.0
6   154.0   145.0   76.0    134.0   175.0
7   77.0    35.0    105.0   108.0   112.0
8   104.0   55.0    113.0   90.0    107.0
9   97.0    253.0   255.0   251.0   141.0
10  224.0   227.0   84.0    214.0   57.0
11  NaN 13.0    51.0    50.0    NaN
12  82.0    213.0   61.0    98.0    59.0
13  NaN 40.0    84.0    7.0 39.0
14  129.0   103.0   65.0    159.0   NaN
15  123.0   128.0   116.0   198.0   111.0

每列都有大约5%的缺失值,我想填写这些NaN 有价值的东西。但是,我不确定该怎么做。任何建议都将受到欢迎。

1 个答案:

答案 0 :(得分:0)

常用方法

  • 完全删除行
  • 将缺失值设置为所有列或属于同一类的条目的均值/中值。