在功能中标记新类别的最佳方法是什么?

时间:2019-03-11 15:03:15

标签: python pandas numpy

有没有一种方法可以手动为切入垃圾箱的要素分配数字标签?

我尝试过:

data['AgeBin'] = pd.cut(data['Age'].astype(int), 5, labels = [1,2,3,4,5])

尽管标签被定义为整数,但它们似乎实际上是一个字符串。

我确实使用

重新映射
age_mapping = {'1':1, '2':2, ...}
data['AgeBin'].map(age_mapping)

可以正常工作,但是我真的很好奇是否有一种更好的方法而不使用LabelEncoder,因为我想保持功能的常规性,并且我想在这里避免OHE。

我还想知道是否要创建年龄密度计数,但说实话我不确定如何写。

0 个答案:

没有答案