Question

说我有两个dfs

df = pd.DataFrame({'A': [1, 2, 3,4,5],
                'B': [2, 4,2,4,5], 'C': [1, -1, 3,5,10],'D': [3, -4,3,7,-3]}, columns=['A', 'B', 'C', 'D'])
df = df.set_index(['A'])

df2 = pd.DataFrame({'A': [1, 2, 3,4,5],
                    'J': ['B', 'B','C','D','C']}, columns=['A', 'J'])
df2 = df2.set_index(['A'])

我希望使用df2逐行选择df列，以获取以下数据框

其中前两个值来自df的第B列，第三个来自col C，第四个来自col D，最后一个来自col C.在pandas中有自然的方法吗？< / p>

Answer 1

indexes使用lookup，df必须相同：

print (df.lookup(df2.index, df2['J']))
[ 2  4  3  7 10]

df = pd.DataFrame({'sel':df.lookup(df2.index, df2['J'])}, index=df.index)
print (df)
   sel
A     
1    2
2    4
3    3
4    7
5   10

Answer 2

您也可以使用np.diag：

x, y= df2.reset_index().values.T
df= pd.DataFrame(np.diag(df.loc[x, y].values), columns=['sel'])
print(df)
   sel
0    2
1    4
2    3
3    7
4   10

根据另一个的列名选择数据框中的行

2 个答案: