标签: apache-spark dataframe apache-spark-sql
df.repartition("countryName", "date")
vs
df.write.partitionBy("countryName", "date")
重新分区是否有助于我针对该数据框进行查询?如果仅使用第一个(repartition)而不使用partitionBy,则写入的文件可能无法分区吗?
repartition
partitionBy