Pandas describe()方法

时间:2018-01-12 11:45:50

标签: python pandas dataframe

我无法理解25%和最大

的含义
dataframe.describe()

我试图寻找它,但没有得到任何暗示。我尝试了不同的数据集,25%并不总是一个整数,因此它不能是小于最大值25%的值的数量。 25%和最大值表示什么?

1 个答案:

答案 0 :(得分:3)

如果检查describe,则percentiles

  

百分位数:类似数字的列表,可选

     

要包含在输出中的百分位数。全部应该介于0和1之间。默认值为[.25,.5,。75],返回第25,第50和第75百分位数。

样品:

df = pd.DataFrame({'B':[4,5,4,5,5,4],
                   'C':[7,8,9,4,2,3],
                   'D':[1,3,5,7,1,0],
})

#print (df)

print (df.describe())
              B         C         D
count  6.000000  6.000000  6.000000
mean   4.500000  5.500000  2.833333
std    0.547723  2.880972  2.714160
min    4.000000  2.000000  0.000000
25%    4.000000  3.250000  1.000000 <-same output
50%    4.500000  5.500000  2.000000
75%    5.000000  7.750000  4.500000
max    5.000000  9.000000  7.000000

print (df.quantile(.25))
B    4.00
C    3.25
D    1.00
Name: 0.25, dtype: float64