标签: python apache-spark
火石与火花
我正在处理Spark数据帧中的许多时间序列数据。具体来说,我想对时间序列数据进行插值以填充数据框中的缺失/空值。看来实现此目标的唯一方法是使用flint或sparks之类的库。这两个之间的主要区别是什么?这2种方法中哪一种效果更好,尤其是对于诸如插补丢失数据的操作? 谢谢!