高级描述熊猫

时间:2014-05-30 16:25:37

标签: python pandas statistics

是否有像熊猫所描述的更高级的功能? 通常我会继续:

r = pd.DataFrame(np.random.randn(1000), columns = ['A'])
r.describe()

我会得到一个很好的总结。就像这个:

                A
count  1000.000000
mean      0.010230
std       0.982562
min      -2.775969
25%      -0.664840
50%       0.015452
75%       0.694440
max       3.101434

我可以在statsmodels或scipy中找到更精细的东西吗?

3 个答案:

答案 0 :(得分:7)

from scipy.stats import describe
describe(r, axis=0)

它会给你大小,(最小,最大),平均值,方差,偏度和峰度

答案 1 :(得分:0)

import pandas_profiling as pp eda = pp.ProfileReport(df) display(eda)

Pandas概要分析是一个非常强大的工具,可以为您提供几乎完整的数据集EDA,包括缺失值,相关性,热图以及其他内容!

答案 2 :(得分:0)

我宁愿使用熊猫库(添加varianceskewnesskurtosis),也不愿使用“外部”库,例如:

    stats = df.describe()
    stats.loc['var'] = df.var().tolist()
    stats.loc['skew'] = df.skew().tolist()
    stats.loc['kurt'] = df.kurtosis().tolist()
    print(stats)

PD:不过pandas_profiling很棒

耶拉特