检索声明时生成的Spark DF模式

时间:2018-01-22 14:25:37

标签: scala apache-spark

我正在创建一个spark df,它在声明时生成了模式信息

val a = df
a: org.apache.spark.sql.DataFrame = [an_array: array<int>, a_map: map<string,string>, a_struct: struct<x:int>, an_array_of_structs: array<struct<foo:string,bar:int,vals:array<double>>>]

在做df.schema时我得到了

res11: org.apache.spark.sql.types.StructType = StructType(StructField(an_array,ArrayType(IntegerType,false),true), StructField(a_map,MapType(StringType,StringType,true),true), StructField(a_struct,StructType(StructField(x,IntegerType,false)),true), StructField(an_array_of_structs,ArrayType(StructType(StructField(foo,StringType,true), StructField(bar,IntegerType,false), StructField(vals,ArrayType(DoubleType,false),true)),true),true))

如何检索变量中的先前信息而不是复杂的模式信息。

1 个答案:

答案 0 :(得分:0)

您看到的是simpleString

df.schema.simpleString