如何根据数据帧另一列中的值是否包含在另一数据帧的特定列中来设置数据帧中一列的值。如果包含该数字,则为1,否则为0。例如:我有两个数据框:
a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6]}
TableB= {'name': ['Braund', 'Cummings', 'Heikkinen', 'Allen','Mary','Celina','Roger'],
'age': [22,38,26,35,41,22,38],
'fare': [7.25, 71.83, 0 , 8.05,7,6.05,6],
'survived?': [False, True, True, False, True, False, True]}
我想检查TableB的“年龄”列中是否包含a的“年龄”列中的每个数字,如果包含的话,请在a中添加列“观察者”并将其值设置为1,如果不是,则为0。
I have tried this:
a['age'].isin(TableB['age'].set_value('Observer',1)
预期结果如下,但我的结果是a的观察者列中的所有值均为1。
a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6],'observer':[1,1,1,0,0,0]}
答案 0 :(得分:1)
a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6]}
a = pd.DataFrame(a)
print (a)
age no
0 22 1
1 38 2
2 26 3
3 62 4
4 198 5
5 27 6
TableB= {'name': ['Braund', 'Cummings', 'Heikkinen', 'Allen','Mary','Celina','Roger'],
'age': [22,38,26,35,41,22,38],
'fare': [7.25, 71.83, 0 , 8.05,7,6.05,6],
'survived?': [False, True, True, False, True, False, True]}
TableB = pd.DataFrame(TableB)
print (TableB)
name age fare survived?
0 Braund 22 7.25 False
1 Cummings 38 71.83 True
2 Heikkinen 26 0.00 True
3 Allen 35 8.05 False
4 Mary 41 7.00 True
5 Celina 22 6.05 False
6 Roger 38 6.00 True
您可以将布尔掩码转换为True/False
到1/0
映射的整数:
a['observer'] = a['age'].isin(TableB['age']).astype(int)
替代解决方案是使用numpy.where
:
a['observer'] = np.where(a['age'].isin(TableB['age']), 1, 0)
print (a)
age no observer
0 22 1 1
1 38 2 1
2 26 3 1
3 62 4 0
4 198 5 0
5 27 6 0
如果使用字典,则将列表理解与if-else
一起使用,并通过in
测试成员资格:
a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6]}
TableB= {'name': ['Braund', 'Cummings', 'Heikkinen', 'Allen','Mary','Celina','Roger'],
'age': [22,38,26,35,41,22,38],
'fare': [7.25, 71.83, 0 , 8.05,7,6.05,6],
'survived?': [False, True, True, False, True, False, True]}
a['observer'] = [1 if x in TableB['age'] else 0 for x in a['age']]
print (a)
{'age': [22, 38, 26, 62, 198, 27], 'no': [1, 2, 3, 4, 5, 6], 'observer': [1, 1, 1, 0, 0, 0]}
答案 1 :(得分:0)
a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6]}
TableB= {'name': ['Braund', 'Cummings', 'Heikkinen', 'Allen'],
'age': [22,38,26,35,41,22,38],
'fare': [7.25, 71.83, 0 , 8.05,7,6.05,6],
'survived?': [False, True, True, False, True, False, True]}
a['observer']=[];
for i in a['age']:
if i in TableB['age'] :
a['observer'].append(1)
else :
a['observer'].append(0)