如何对带或不带国家/地区代码的电话号码进行分组

时间:2018-06-25 07:17:54

标签: python pandas dataframe

我正在尝试检测电话号码,我的国家/地区代码为+62,但是一些电话制造商或运营商在查询并进行数据透视后使用了0+62,但我得到了数据透视。但是,数据透视是没有上下文的

这是关键数据

Id    +623684682   03684682   +623684684   03684684
1              1          0            1          1
2              1          1            2          1

这是我需要分组的内容,但我不想手动分组(+62368468203684682相同,等等)

Id      03684682   03684684
1              1          2
2              2          3

1 个答案:

答案 0 :(得分:4)

我认为需要replace和总计sum

df = df.groupby(lambda x: x.replace('+62','0'), axis=1).sum()

replace列名和sum

df.columns = df.columns.str.replace('\+62','0')
df = df.sum(level=0, axis=1)

print (df)
    03684682  03684684
Id                    
1          1         2
2          2         3