应用错误收集

熊猫df插值等效于Spark df

时间：2019-05-01 14:56:49

标签： python apache-spark-sql

我有一个带有特定时间序列列的Spark df。这些列中有一些空值。在熊猫中，我可以使用'interpolate'方法轻松地对它们进行插值，但是找不到与之等效的Spark df。这个问题有2部分- 1）如何在Spark df中插值？ 2）如何仅在某些列（而不是所有列）上使用该功能？

下面是我如何在pnadas中做到这一点。有没有办法用Spark df

实现

Pandas df-

df.loc[:,'col2':'col5']=df.loc[:,'col2':'col5'].interpolate(axis=1)

0 个答案:

没有答案