我是scala / spark的新手,我正在尝试循环数据帧并在循环进行时分配结果。以下代码有效,但只能将结果打印到屏幕上。
traincategory.columns.foreach { x=>
val test1 = traincategory.select("Id", x)
import org.apache.spark.ml.feature.{OneHotEncoder, StringIndexer}
//CODE TO PERFORM ONEHOT TRANSFORMATION
val encoded = encoder.transform(indexed)
encoded.show()
}
由于val是不可变的,我试图将这个转换中的向量附加到另一个变量上,如在R中所做的那样。
//var ended = traincategory.withColumn(x,encoded(0))
我怀疑Scala有一种更惯用的处理方式。
提前感谢您的帮助。
答案 0 :(得分:0)