我无法理解25%和最大
的含义dataframe.describe()
我试图寻找它,但没有得到任何暗示。我尝试了不同的数据集,25%并不总是一个整数,因此它不能是小于最大值25%的值的数量。 25%和最大值表示什么?
答案 0 :(得分:3)
如果检查describe
,则percentiles
:
百分位数:类似数字的列表,可选
要包含在输出中的百分位数。全部应该介于0和1之间。默认值为[.25,.5,。75],返回第25,第50和第75百分位数。
样品:
df = pd.DataFrame({'B':[4,5,4,5,5,4],
'C':[7,8,9,4,2,3],
'D':[1,3,5,7,1,0],
})
#print (df)
print (df.describe())
B C D
count 6.000000 6.000000 6.000000
mean 4.500000 5.500000 2.833333
std 0.547723 2.880972 2.714160
min 4.000000 2.000000 0.000000
25% 4.000000 3.250000 1.000000 <-same output
50% 4.500000 5.500000 2.000000
75% 5.000000 7.750000 4.500000
max 5.000000 9.000000 7.000000
print (df.quantile(.25))
B 4.00
C 3.25
D 1.00
Name: 0.25, dtype: float64