我怎么称呼四分位数有问题。 这是csv文件:drinksbycountry.csv 我在新列中显示了“啤酒份量”列中的分位数。
df['nowa'] = pd.qcut(df['beer_servings'],6)
df.loc[1:5,['country', 'continent0','nowa' ]]
结果:
我不想有以下间隔:(225.0,376.0]。 我想展示:“第1组”,“第2组” 该怎么做?
答案 0 :(得分:3)
使用参数labels
:
标签:数组或布尔值,默认为无
用作生成的垃圾箱的标签。必须与生成的垃圾箱长度相同。如果为False,则仅返回垃圾箱的整数指标。
df['nowa'] = 'group ' + pd.qcut(df['beer_servings'],6, labels=False).astype(str)
也可以在列表中创建标签-例如与f-string
在一起的列表理解中:
labels = [f'group {x}' for x in range(6)]
df['nowa'] = pd.qcut(df['beer_servings'],6, labels=labels)