我正在使用pandas
中的插值函数。这是一个举例说明的案例:
df=pd.DataFrame({'Data':np.random.normal(size=200), 'Data2':np.random.normal(size=200)})
df.iloc[1, 0] = np.nan
print df
print df.interpolate('nearest')
我的问题:interpolate
函数是否适用于多列?也就是说,它是否使用多变量分析来确定缺失字段的值?或者它只是看单个列?
答案 0 :(得分:0)
docs引用了各种可用的方法 - 大多数只依赖于index
,可能通过单变量scipy.interp1d
或其他单变量scipy
方法:
方法:{'线性','时间','索引','值','最近','零', 'slinear','quadratic','cubic','barycentric','krogh','polynomial', 'spline''piecewise_polynomial','pchip'}
Scipy docs以及说明输出here
的图表