我有一个数据框,其中包含两列,分别作为名称和年龄索引,现在我想根据年龄范围(例如11-20岁,21-30岁等)对这些数据进行分组。 我的思考过程:添加新列并根据满足年龄范围的条件分配值,然后根据新分配的值进行分组。但是,我无法编码这种想法。我是python的新手。谁能帮我?也欢迎任何其他技术来做到这一点。最终目的是对年龄范围内的数据进行分类并进行探索性分析。
这是我的代码:
dic_1 = pd.DataFrame({'name': ['ram','shyam','mohan', 'kalpesh', 'suresh'],
'Age' : [15,30,40,50,60]})
df_1 = pd.DataFrame(dic_1)
df_1 ['group'] = np.array(np.random.randn(len(df_1['Age'])))
df_1.loc[df_1['Age'] < 20, 'group'] = "below twenty"
df_1.loc[20 <= df_1['Age'] < 30, 'group'] = "twenty to thrity"
df_1.loc[30 <= df_1['Age'] < 40, 'group'] = "thrity to forty"
df_1.loc[df_1['Age'] > 40, 'group'] = "above forty"
print (df_1)