wordsDF = sqlContext.createDataFrame([('cat',), ('elephant',), ('rat',), ('rat',), ('cat', )], ['word'])
这是一种从python中的元组列表创建数据帧的方法。我怎么能在scala中这样做?我是Scala的新手,我在解决问题时遇到了问题。
任何帮助将不胜感激!
答案 0 :(得分:4)
一种简单的方法,
val df = sc.parallelize(List( (1,"a"), (2,"b") )).toDF("key","value")
所以df.show
+---+-----+
|key|value|
+---+-----+
| 1| a|
| 2| b|
+---+-----+
请参阅Programmatically Specifying the Schema中的工作示例,了解使用DataFrame
构建createDataFrame
。