如何称四分位数?

时间:2019-04-03 06:48:31

标签: python pandas

我怎么称呼四分位数有问题。 这是csv文件:drinksbycountry.csv 我在新列中显示了“啤酒份量”列中的分位数。

df['nowa'] = pd.qcut(df['beer_servings'],6)
df.loc[1:5,['country', 'continent0','nowa' ]]

结果:

我不想有以下间隔:(225.0,376.0]。 我想展示:“第1组”,“第2组” 该怎么做?

1 个答案:

答案 0 :(得分:3)

使用参数labels

  

标签:数组或布尔值,默认为无
  用作生成的垃圾箱的标签。必须与生成的垃圾箱长度相同。如果为False,则仅返回垃圾箱的整数指标。

df['nowa'] = 'group ' + pd.qcut(df['beer_servings'],6, labels=False).astype(str)

也可以在列表中创建标签-例如与f-string在一起的列表理解中:

labels = [f'group {x}' for x in range(6)]
df['nowa'] =  pd.qcut(df['beer_servings'],6, labels=labels)