标签: apache-spark dataframe
我有一个包含2000列的DateFrame。我想删除出现值Double.Infinity的那些列,或将该值替换为该列的平均值(最好替换)。
Double.Infinity
如果我在所有列上都使用循环并使用.drop(col),则它的运行速度非常慢。如何快速做到?