我有两个 dfs,
df1(带重复行):
mean_date d_id p_val x_mean
2021-04-02 x_122 7 0.32
2021-04-03 x_122 7 0.54
2021-04-02 x_122 7 0.23
2021-04-03 x_122 7 0.31
..
2021-03-28 x_222 2 1.2
2021-03-29 x_222 2 2.2
df2:
mean_date d_id
2021-03-28 x_122
2021-03-29 x_122
2021-03-30 x_122
2021-03-31 x_122
.
.
2021-03-30 x_222
2021-03-31 x_222
2021-04-01 x_222
2021-04-02 x_222
并且 result_df 应该是:
res_df:
因为对于 d_id
x_122
,p_val
是 7
并且只有 2 个(df_1
中唯一的 mean_date 行)所以我们将记录剩余的 { {1}},但不适用于 5
,因为它满足其行的 d_id = x_222
。
p_val = 2