有没有一种方法可以手动为切入垃圾箱的要素分配数字标签?
我尝试过:
data['AgeBin'] = pd.cut(data['Age'].astype(int), 5, labels = [1,2,3,4,5])
尽管标签被定义为整数,但它们似乎实际上是一个字符串。
我确实使用
重新映射age_mapping = {'1':1, '2':2, ...}
data['AgeBin'].map(age_mapping)
可以正常工作,但是我真的很好奇是否有一种更好的方法而不使用LabelEncoder,因为我想保持功能的常规性,并且我想在这里避免OHE。
我还想知道是否要创建年龄密度计数,但说实话我不确定如何写。