Question

我有一个pandas df：

import pandas as pd
df = pd.DataFrame({'col_a' : ['a','a', 'b'], 'col_b': [1,2,3]})
df.index = [4,5,6]

我在此df上执行查询：

df_subset = df.query('col_a == "b"')

现在我有第二个数据框，如下所示：

import numpy as np
df_numpy = pd.DataFrame(np.array([0.1,0.2,0.3]))

类似于原始的df，但没有“ identification”列（col_a），并且值以某种方式转换（在此玩具示例中，为10）

我想在应用查询后从df_numpy中选择与df中相同的行。在这个玩具示例中，第三行。

编辑棘手的部分是df_numpy和df之间的索引值不相同。

有办法吗？

Answer 1

如果索引值相同，请使用：

print (df_numpy[df_numpy.index.isin(df_subset.index)])    
     0
2  0.3

编辑：一种想法是在两者中创建相同的索引值，因为长度相同：

df = pd.DataFrame({'col_a' : ['a','a', 'b'], 'col_b': [1,2,3]})
df.index = [4,5,6]

df_subset = df.reset_index(drop=True).query('col_a == "b"')

df_numpy = pd.DataFrame(np.array([0.1,0.2,0.3]))


print (df_numpy[df_numpy.reset_index(drop=True).index.isin(df_subset.index)])

     0
2  0.3

如何使用另一个数据帧的熊猫查询结果过滤熊猫数据帧

1 个答案: