在Spark中打印出数据框列的类型

时间:2016-09-24 01:13:06

标签: pyspark

我尝试在我的Spark数据框架上使用VectorAssembler,它抱怨它不支持StringType类型。我的数据框有2126列。

打印出所有列类型的编程方法是什么?

2 个答案:

答案 0 :(得分:16)

尝试:

>>> for name, dtype in df.dtypes:
...     print(name, dtype)

>>> df.schema

答案 1 :(得分:5)

df.printSchema()将以易于遵循的格式为您打印数据框架构