标签: dataframe parquet
我有一个实木复合地板文件,该文件使用partitionBy子句写入S3,这会在文件夹中创建许多分区,这很好。 我正在使用的命令是df.write.partitionBy(“ partitioned column”)。parquet(“文件路径”)。
这太好了,我正在读取一个数据帧中的文件并描述了架构,尽管我正在使用通配符读取包含所有已分区文件的文件夹,但未看到分区列。
问题:如何将分区列的这个文件读入数据框?