如何用SFrame中的中位数或模式替换缺失值?

时间:2016-09-07 22:33:57

标签: python pandas graphlab

我正在阅读Graphlab文档,我试图弄清楚如何复制pandas功能是na值被中位数,平均值或模式等取代... 在熊猫你只需这样做: df.dropna()。中位数() 要么 df.dropna()。意思是() 等....

但是关于SFrame的dropna和fillna函数的文档没有提到类似的东西。在SFrame中可以吗?

1 个答案:

答案 0 :(得分:2)

有一个,但只有平均值可用,而不是中位数。 请查看:graphlab.toolkits.feature_engineering.NumericImputerdoc

  

使用功能方法估算缺失值。

     

NumericImputer的输入列必须是int,float,dict类型,   list或array.array。对于输入中的每一列,进行转换   output是一个列,其中输入保留原样如果:

     
      
  • 没有遗漏的价值。
  •   
     

不满足上述要求的输入设置为该功能的平均值。

如果中位数是您想要的,您可以通过以下方式实现:

data.fillna('feature_name', np.median(data['feature_name']))