标签: apache-spark hive parquet hive-table
如何通过读取Parquet文件架构自动创建配置单元外部表?创建时会不会有任何数据类型不匹配?
已将镶木地板文件加载到数据框并提取了架构 val parquetDataSchema = spark.read.parquet(sourceDirectory)
并从数据框中提取架构 val schema = parquetDataSchema.dtypes
我已经创建了配置单元表。