标签: scala apache-spark
我有大约20k双打的大向量,其中大多数都是空的。是否可以将其转换为SparseVector以及如何?
答案 0 :(得分:2)
org.apache.spark.ml.linalg.Vector提供了toSparse和toDense方法,可用于更改表示形式。
org.apache.spark.ml.linalg.Vector
toSparse
toDense
但是,首先不应该Vector {或scala.Double包含nulls的{{1}}集合。
Vector
scala.Double
nulls