从scala中的数据框添加两列

时间:2016-10-14 10:57:15

标签: scala apache-spark apache-spark-sql apache-spark-2.0

我有两列年龄和工资存储在DF中。我只想编写一个scala代码来逐列添加这些值。我试过了

val age_1 = df.select("age")
val salary_1=df.select("salary")
val add = age_1+salary_1

给我错误。请帮忙

1 个答案:

答案 0 :(得分:7)

以下sparkSparkSession的实例,因此在实例化spark后,导入必须

$ - 表示法可以通过导入带有

的spark implicits来使用
import spark.implicits._ 

然后使用$ -notation

val add = df.select($"age" + $"salary")

最终scala代码:

import spark.implicits._
val add = df.select($"age" + $"salary")

Apache doc