在Dask DataFrame中汇总分类数据

时间:2018-01-24 13:01:02

标签: python dask

默认情况下,Dask DataFrame的describe方法仅汇总数字列。根据{{​​3}},我应该能够通过提供include参数来获取分类列的描述。然而

df.describe(include=['category']).compute()

导致

TypeError: describe() got an unexpected keyword argument 'include'

我也尝试了一种不同的方法:

df.select_dtypes(include=['category']).describe().compute()

这次我得到

ValueError: DataFrame contains only non-numeric data.

您能否告诉我们在Dask DataFrame中总结分类列的最佳方法是什么?

1 个答案:

答案 0 :(得分:2)

仅汇总数字或对象列

  1. 仅在数字列上调用describe() describe(include = [np.number])
  2. 使用以下命令仅在对象(字符串)上调用describe() describe(include = ['O'])。

报价:Pandas 'describe' is not returning summary of all columns