我有一个ID,值,缺少值(这是%age)的数据框。然后,我想拥有另一列的范围,如果缺少的值是
我有什么最好的方法
数据框示例
df = pd.DataFrame({
'id': ['1245', '1323', '1784', '1557','1456'],
'value': [11558522, 12323552, 13770958, 18412280, 13770958],
'missing value': [34, 56, 80, 5 76]
})
答案 0 :(得分:0)
您可以使用pandas cut将ur列划分为bins
if
答案 1 :(得分:0)
另一种方法是将apply方法用作:
def RangeDefiner(val):
if val<=25:
return 1
elif val<=50:
return 2
elif val<=75:
return 3
elif val<=80:
return 4
并获取范围:
df['ranges']=df.apply(lambda x: RangeDefiner(x['missing value']), axis=1)
输入的输出:
id value missing value ranges
0 1245 11558522 34 2
1 1323 12323552 56 3
2 1784 13770958 80 4
3 1557 18412280 5 1
4 1456 13770958 76 4