Scala中的数据框创建

时间:2016-05-12 09:05:05

标签: scala apache-spark dataframe

wordsDF = sqlContext.createDataFrame([('cat',), ('elephant',), ('rat',), ('rat',), ('cat', )], ['word'])

这是一种从python中的元组列表创建数据帧的方法。我怎么能在scala中这样做?我是Scala的新手,我在解决问题时遇到了问题。

任何帮助将不胜感激!

1 个答案:

答案 0 :(得分:4)

一种简单的方法,

val df = sc.parallelize(List( (1,"a"), (2,"b") )).toDF("key","value")

所以df.show

+---+-----+
|key|value|
+---+-----+
|  1|    a|
|  2|    b|
+---+-----+

请参阅Programmatically Specifying the Schema中的工作示例,了解使用DataFrame构建createDataFrame