熊猫根据多索引值替换DataFrame值

时间:2020-03-19 21:02:16

标签: python pandas replace conditional-statements multi-index

我有两个数据框,其中第一个数据框索引/列与第二个数据框索引/列相关。在 df1 中,列是 df2 的月份,行是索引的下层。我想根据该关系在 df2 中分发 df1 。这是一个简化的示例:

df1 = pd.DataFrame([[1, 2], [3, 4]], index= [1,2], columns=[1, 6])

index_list = [[1, 1, 2, 2],[1,2,1,2]]
header_list = [np.datetime64('2020-01-01'), np.datetime64('2020-06-01'),np.datetime64('2021-01-01'),np.datetime64('2021-06-01')]
df2 = pd.DataFrame(index=index_list, columns=header_list)

enter image description here

1 个答案:

答案 0 :(得分:0)

有点工作,但是没有主要障碍。

df1.index.name, df1.columns.name = 'key', 'month'
df2.index.names, df2.columns.name = ['a', 'key'], 'date'
x = df1.stack().reset_index().rename(columns={0: 'value'})
y = df2.fillna(0).stack().reset_index(level=-1).drop(0, axis=1)
y['month'] = y['date'].apply(lambda z: z.month)
y = y.reset_index().merge(x, on=['key', 'month']).drop('month', axis=1)
y = y.set_index(['a', 'key', 'date']).unstack('date')