Pandas'pd.cut
方法(link to documentation)有一个labels
参数,指示每个剪切区域的标记方式(文档使用示例'低','中','每个箱子都很高。
我正在尝试使用美元符号($)进行标记,但pd.cut
(尽管正确地对分类进行分类)并未显示数据框中的美元符号。
对于此数据框:
Salary
0 50000
1 50000
2 50000
我申请以下内容:
bins = [0, 35000, 50000, 75000, 100000]
group_names = ['<=$35K', '$35K-$50K', '$50K-$75K', '$75K-$100K']
DF.loc[:,'category'] = pd.cut(DF.Salary, bins, labels=group_names)
但这导致以下结果:
我想要的是这个:
Salary Category
0 50000 $35K-$50K
1 50000 $35K-$50K
2 50000 $35K-$50K
你可以帮帮我吗?
答案 0 :(得分:0)
美元符号是特殊字符并在正则表达式中使用,因此如果您希望它们出现在您的数据中,则必须将它们转义。
将字符串更改为以下内容通知python美元符号是字符串的一部分。
group_names = ['<=\$35K', '\$35K-\$50K', '\$50K-\$75K', '\$75K-\$100K']