如何使用Python推断给定数据以填充NaN值?

时间:2018-06-13 05:17:16

标签: python pandas machine-learning dataset nan

我希望用适当的推断来填充NaN值。我认为曲线拟合方法不合适,因为我对给定点的曲线方程没有任何线索。我从MPU获得了这些值。任何人都可以建议我使用Python推断值填充NaN位置的最佳方法吗?

mean_acc  timestamp     x_acc   x_gyro  y_acc   y_gyro  z_acc   z_gyro

  1.00     1143            0.96     -1.22     0.16     2.81  0.24  0.24

  1.17    1646             1.15     -7.26   0.14    4.88    0.18    -0.06

  1.02     2149            1.00     8.36    0.15    11.78   0.12    3.11

   0.98     2652           0.96     -8.30   0.15    2.01    0.11    -2.01

   1.05     3155           0.94     -4.21   0.17    3.42    0.42    -2.93

   1.01     3658           1.00     2.75    0.12    4.64    0.05    5.13

    NaN     4161            NaN     NaN     NaN     NaN     NaN     NaN

    NaN     4664            NaN     NaN     NaN     NaN     NaN     NaN

    NaN     5167             NaN    NaN     NaN     NaN     NaN     NaN

    NaN     5670             NaN    NaN     NaN     NaN     NaN     NaN

1 个答案:

答案 0 :(得分:0)

通过阅读你的问题,我对你真正想要的答案感到困惑 -

  1. 推断或
  2. 的不同方法
  3. 如何使用特定的外推方法将NA值填充到列中。
  4. 但是我会尝试回答这两个问题。

    mean_acc,x_acc,y_acc,z_acc空值可以用它们的平均值填充。 对于y_gyro,将现有转换为Log Transforms,然后推断Log值的平均值,然后反转Log转换以获得所需的。

    尝试绘制其余字段,并尝试找到可用于推断其余列中的NULL值的关系。

    1. 外推pandas中的空值。

      X ['mean_acc']。fillna(X ['mean_acc']。mean(),inplace = True)