使用python将一个实木复合地板文件分为3个实木复合地板文件

时间:2018-07-11 10:06:46

标签: python parquet

是否有办法(使用Python)将巨大的实木复合地板文件分成较小的文件?保留所有列并划分行? 谢谢

1 个答案:

答案 0 :(得分:1)

您可以使用dask来做到这一点。

import dask.dataframe as dd

ddf = dd.read_parquet('my_file.parquet')
ddf.repartition(npartitions=3).to_parquet('my_files/')

修改: 您需要安装fastparquetpyarrow