我有一列的格式如下:
American express,Visa,Master Card,Diners
American express,Visa,Master Card,Bancomat
all
Visa,Master Card,Diners,Banco
如果要在列表中找到给定的卡片,我想为每个元素创建1或0的不同列。
预期结果应该是这样的:
Visa American Express Master Card Diners Bancomat
1 1 1 1 0
1 1 1 0 1
1 1 1 1 1
1 0 1 1 0
大熊猫有办法吗?
答案 0 :(得分:2)
使用Series.str.get_dummies
处理DataFrame.add
和DataFrame.pop
的all
列以提取列:
print (df)
col
0 American express,Visa,Master Card,Diners
1 American express,Visa,Master Card,Bancomat
2 all
3 Visa,Master Card,Diners,Bancomat
df = df['col'].str.get_dummies(',')
df = df.add(df.pop('all'), axis=0)
#alternative
#df += df.pop('all')[:, None]
print (df)
American express Bancomat Diners Master Card Visa
0 1 0 1 1 1
1 1 1 0 1 1
2 1 1 1 1 1
3 0 1 1 1 1