默认情况下,Dask DataFrame的describe
方法仅汇总数字列。根据{{3}},我应该能够通过提供include
参数来获取分类列的描述。然而
df.describe(include=['category']).compute()
导致
TypeError: describe() got an unexpected keyword argument 'include'
。
我也尝试了一种不同的方法:
df.select_dtypes(include=['category']).describe().compute()
这次我得到
ValueError: DataFrame contains only non-numeric data.
您能否告诉我们在Dask DataFrame中总结分类列的最佳方法是什么?
答案 0 :(得分:2)
仅汇总数字或对象列
报价:Pandas 'describe' is not returning summary of all columns