熊猫的分组年龄

时间:2020-03-18 00:35:53

标签: python pandas

我正在尝试将年龄列分为不同的组。这些组是

(“Children”: 0-14 years; “Youth”: 15-24 years; “Adults”: 25-65 years; “Seniors”: 65 +)

我确实尝试过使用panda cut,但看来我的bin值远远超过了标签,这是到目前为止的代码

bins = [0,14,15,24,25,65]
category_names = ['Children', 'Youth', 'Adults', 'Seniors', np.inf]
df3['AgeGroup'] = pd.cut(df3['Age'], bins=bins, labels=category_names)

感谢您的帮助,ty

1 个答案:

答案 0 :(得分:0)

是:您为4个垃圾箱提供了6个临界值。重新访问有关如何指定这些分区值的文档。您需要消除多余的那些,可能是14和24。还请注意,除非您为早产者创建类别,否则0是多余的。

您有4个类别;这要求3个分区值。

bins = [0,15,25,65]
category_names = ['Children', 'Youth', 'Adults', 'Seniors']

还请注意,我已从您的字符串标签列表中删除了不适用的“无穷大”值。