我正在尝试检测电话号码,我的国家/地区代码为+62
,但是一些电话制造商或运营商在查询并进行数据透视后使用了0
和+62
,但我得到了数据透视。但是,数据透视是没有上下文的
这是关键数据
Id +623684682 03684682 +623684684 03684684
1 1 0 1 1
2 1 1 2 1
这是我需要分组的内容,但我不想手动分组(+623684682
和03684682
相同,等等)
Id 03684682 03684684
1 1 2
2 2 3
答案 0 :(得分:4)
我认为需要replace
和总计sum
:
df = df.groupby(lambda x: x.replace('+62','0'), axis=1).sum()
或replace
列名和sum
:
df.columns = df.columns.str.replace('\+62','0')
df = df.sum(level=0, axis=1)
print (df)
03684682 03684684
Id
1 1 2
2 2 3