我正在创建一个spark df,它在声明时生成了模式信息
val a = df
a: org.apache.spark.sql.DataFrame = [an_array: array<int>, a_map: map<string,string>, a_struct: struct<x:int>, an_array_of_structs: array<struct<foo:string,bar:int,vals:array<double>>>]
在做df.schema
时我得到了
res11: org.apache.spark.sql.types.StructType = StructType(StructField(an_array,ArrayType(IntegerType,false),true), StructField(a_map,MapType(StringType,StringType,true),true), StructField(a_struct,StructType(StructField(x,IntegerType,false)),true), StructField(an_array_of_structs,ArrayType(StructType(StructField(foo,StringType,true), StructField(bar,IntegerType,false), StructField(vals,ArrayType(DoubleType,false),true)),true),true))
如何检索变量中的先前信息而不是复杂的模式信息。
答案 0 :(得分:0)
您看到的是simpleString
:
df.schema.simpleString