如何在Spark 1.5.2上使用pyspark删除镶木地板隔断?

时间:2016-07-11 14:30:10

标签: pyspark

一旦我们将数据加载到作为整数格式划分的业务日期的praquet文件 - yyyyMMdd,我们如何删除分区并促进同一天的数据重新处理。覆盖模式会重写已经很大的整个文件。

0 个答案:

没有答案