我有一个类似于以下内容的数据框:
A
0 4.716
1 9.982
2 8.047
3 10.11
4 7.693
我需要做的是对这些值进行bin,并在这种情况下将其存储在另一列中:
1)如果值小于7,则为'<7'
2)如果值从7到7.5,则为“ 7-7.5”
3)如果值从7.51到8,则为“ 7.5-8.0”
4)如果值从8.01到8.5,则为“ 8.0-8.5”
...继续...
最后,如果值从10.01到10.5,则为“ 10.0-10.5”
在这里使用pd.cut不能提供我需要的结果,垃圾箱的分布不均等(例如,等价散布:这些值是从6.92-7.116合并的,我希望这是两个单独的垃圾箱)
由于数据量很大,因此运行循环非常耗时。如果可以解决,那真的有帮助吗?感谢您的帮助。
需要的输出:
A B
0 4.716 < 7
1 9.982 9.5 - 10
2 8.047 8 - 8.5
3 10.11 10 - 10.5
4 7.693 7.5 -8