如何将列添加到mapPartitions中的org.apache.spark.sql.Row中

时间:2015-11-23 16:42:46

标签: scala apache-spark

我是scala和spark的新手,请记住:)

实际上,我有三个问题

  1. 我应该如何定义函数以将其传递到df.rdd.mapPartitions,如果我想创建新的Row,只需要很少的其他列
  2. 如何在Row对象中添加少量列(或创建新列)
  3. 如何从创建的RDD创建DataFrame
  4. 提前谢谢

0 个答案:

没有答案