我有一个带有特定时间序列列的Spark df。这些列中有一些空值。在熊猫中,我可以使用'interpolate'方法轻松地对它们进行插值,但是找不到与之等效的Spark df。 这个问题有2部分- 1)如何在Spark df中插值? 2)如何仅在某些列(而不是所有列)上使用该功能?
下面是我如何在pnadas中做到这一点。有没有办法用Spark df
实现Pandas df-
df.loc[:,'col2':'col5']=df.loc[:,'col2':'col5'].interpolate(axis=1)