使用Java删除列并删除Spark DataFrame中的值

时间:2018-08-09 13:19:18

标签: apache-spark dataframe

我有一个包含2000列的DateFrame。我想删除出现值Double.Infinity的那些列,或将该值替换为该列的平均值(最好替换)。

如果我在所有列上都使用循环并使用.drop(col),则它的运行速度非常慢。如何快速做到?

0 个答案:

没有答案