熊猫pd.cut标签与美元符号

时间:2016-12-02 23:09:56

标签: python pandas

Pandas'pd.cut方法(link to documentation)有一个labels参数,指示每个剪切区域的标记方式(文档使用示例'低','中','每个箱子都很高。

我正在尝试使用美元符号($)进行标记,但pd.cut(尽管正确地对分类进行分类)并未显示数据框中的美元符号。

对于此数据框:

    Salary
0   50000
1   50000
2   50000

我申请以下内容:

bins = [0, 35000, 50000, 75000, 100000]
group_names = ['<=$35K', '$35K-$50K', '$50K-$75K', '$75K-$100K']

DF.loc[:,'category'] = pd.cut(DF.Salary, bins, labels=group_names)

但这导致以下结果:

enter image description here

我想要的是这个:

    Salary   Category
0   50000    $35K-$50K
1   50000    $35K-$50K
2   50000    $35K-$50K
你可以帮帮我吗?

1 个答案:

答案 0 :(得分:0)

美元符号是特殊字符并在正则表达式中使用,因此如果您希望它们出现在您的数据中,则必须将它们转义。

将字符串更改为以下内容通知python美元符号是字符串的一部分。

group_names = ['<=\$35K', '\$35K-\$50K', '\$50K-\$75K', '\$75K-\$100K']