熊猫df插值等效于Spark df

时间:2019-05-01 14:56:49

标签: python apache-spark-sql

我有一个带有特定时间序列列的Spark df。这些列中有一些空值。在熊猫中,我可以使用'interpolate'方法轻松地对它们进行插值,但是找不到与之等效的Spark df。 这个问题有2部分- 1)如何在Spark df中插值? 2)如何仅在某些列(而不是所有列)上使用该功能?

下面是我如何在pnadas中做到这一点。有没有办法用Spark df

实现

Pandas df-

df.loc[:,'col2':'col5']=df.loc[:,'col2':'col5'].interpolate(axis=1)

0 个答案:

没有答案