我正在阅读Graphlab文档,我试图弄清楚如何复制pandas功能是na值被中位数,平均值或模式等取代... 在熊猫你只需这样做: df.dropna()。中位数() 要么 df.dropna()。意思是() 等....
但是关于SFrame的dropna和fillna函数的文档没有提到类似的东西。在SFrame中可以吗?
答案 0 :(得分:2)
有一个,但只有平均值可用,而不是中位数。
请查看:graphlab.toolkits.feature_engineering.NumericImputer
(doc)
使用功能方法估算缺失值。
NumericImputer的输入列必须是int,float,dict类型, list或array.array。对于输入中的每一列,进行转换 output是一个列,其中输入保留原样如果:
- 没有遗漏的价值。
不满足上述要求的输入设置为该功能的平均值。
如果中位数是您想要的,您可以通过以下方式实现:
data.fillna('feature_name', np.median(data['feature_name']))