如何根据另一个数据帧的特定列中是否包含另一列的值来设置一个数据帧的列值

时间:2019-09-18 06:03:44

标签: python python-3.x pandas merge anaconda

如何根据数据帧另一列中的值是否包含在另一数据帧的特定列中来设置数据帧中一列的值。如果包含该数字,则为1,否则为0。例如:我有两个数据框:

a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6]} 


TableB= {'name': ['Braund', 'Cummings', 'Heikkinen', 'Allen','Mary','Celina','Roger'],
'age': [22,38,26,35,41,22,38],
'fare': [7.25, 71.83, 0 , 8.05,7,6.05,6], 
'survived?': [False, True, True, False, True, False, True]}

我想检查TableB的“年龄”列中是否包含a的“年龄”列中的每个数字,如果包含的话,请在a中添加列“观察者”并将其值设置为1,如果不是,则为0。

I have tried this:

a['age'].isin(TableB['age'].set_value('Observer',1)

预期结果如下,但我的结果是a的观察者列中的所有值均为1。

a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6],'observer':[1,1,1,0,0,0]}

2 个答案:

答案 0 :(得分:1)

a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6]} 
a = pd.DataFrame(a)
print (a)
   age  no
0   22   1
1   38   2
2   26   3
3   62   4
4  198   5
5   27   6

TableB= {'name': ['Braund', 'Cummings', 'Heikkinen', 'Allen','Mary','Celina','Roger'],
'age': [22,38,26,35,41,22,38],
'fare': [7.25, 71.83, 0 , 8.05,7,6.05,6], 
'survived?': [False, True, True, False, True, False, True]}

TableB = pd.DataFrame(TableB)
print (TableB)
        name  age   fare  survived?
0     Braund   22   7.25      False
1   Cummings   38  71.83       True
2  Heikkinen   26   0.00       True
3      Allen   35   8.05      False
4       Mary   41   7.00       True
5     Celina   22   6.05      False
6      Roger   38   6.00       True

您可以将布尔掩码转换为True/False1/0映射的整数:

a['observer'] = a['age'].isin(TableB['age']).astype(int)

替代解决方案是使用numpy.where

a['observer'] = np.where(a['age'].isin(TableB['age']), 1, 0)
print (a)
   age  no  observer
0   22   1         1
1   38   2         1
2   26   3         1
3   62   4         0
4  198   5         0
5   27   6         0

如果使用字典,则将列表理解与if-else一起使用,并通过in测试成员资格:

a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6]} 

TableB= {'name': ['Braund', 'Cummings', 'Heikkinen', 'Allen','Mary','Celina','Roger'],
'age': [22,38,26,35,41,22,38],
'fare': [7.25, 71.83, 0 , 8.05,7,6.05,6], 
'survived?': [False, True, True, False, True, False, True]}


a['observer'] = [1 if x in TableB['age'] else 0 for x in a['age']]
print (a)
{'age': [22, 38, 26, 62, 198, 27], 'no': [1, 2, 3, 4, 5, 6], 'observer': [1, 1, 1, 0, 0, 0]}

答案 1 :(得分:0)

a={'age':[22,38,26,62,198,27],'no':[1,2,3,4,5,6]} 
TableB= {'name': ['Braund', 'Cummings', 'Heikkinen', 'Allen'],
'age': [22,38,26,35,41,22,38],
'fare': [7.25, 71.83, 0 , 8.05,7,6.05,6], 
'survived?': [False, True, True, False, True, False, True]}
 a['observer']=[];

for i in a['age']:
  if i in  TableB['age'] :
     a['observer'].append(1)
  else :
      a['observer'].append(0)