是否可以使用Spark 2.4将包含JSON字符串的DataFrame转换为包含JSON字符串的类型表示形式的DataFrame?
例如:给定以下定义,我想使用从JSON字符串推断出的模式转换jsonDF
中的单列。
val jsonDF = spark.sparkContext.parallelize(Seq("""{"a": 1, "b": 2}""")).toDF
答案 0 :(得分:1)
DataFrameReader
可以从字符串数据集中读取JSON。例如,使用toDS
代替toDF
val jsonDS = Seq("""{"a": 1, "b": 2}""").toDS
spark.read.json(jsonDS).show()
输出:
+---+---+
| a| b|
+---+---+
| 1| 2|
+---+---+