标签: pyspark
我尝试在我的Spark数据框架上使用VectorAssembler,它抱怨它不支持StringType类型。我的数据框有2126列。
打印出所有列类型的编程方法是什么?
答案 0 :(得分:16)
尝试:
>>> for name, dtype in df.dtypes: ... print(name, dtype)
或
>>> df.schema
答案 1 :(得分:5)
df.printSchema()将以易于遵循的格式为您打印数据框架构
df.printSchema()