是否可以在pandas.cut
中指定自定义范围?
我有一个数据集,需要对年龄列(以及其他几列)进行分类。数据集中min
的{{1}}和max
值分别为age
和18
。但是,在数据集的文档中,记录了属性55
的范围是age
。
18-58
将根据数据集的范围(将为pandas.cut
)自动进行分档,这是错误的。
有什么办法可以在18-55
方法中指定要合并的范围?我将pandas.cut
元组视为垃圾箱,但这意味着我自己手动生成垃圾箱。我正在寻找IntervalIndex
是否内置此功能。
答案 0 :(得分:0)
不,不是直接。
但是,您可以将np.linspace(18, 58, n_bins)
传递给pd.cut
。我不确定您是否认为“手动生成”。